加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

龚呆子seo说蜘蛛陷阱问题

(2012-04-18 21:05:38)
标签:

蜘蛛陷阱

百度蜘蛛

网络营销

seo知识

seo技巧

搜索引擎

搜索引擎优化

it

分类: 电子商务
常见的蜘蛛陷阱有:
1) 网站URL含有动态元素
这些动态元素包括问号,参数以及等号等,一般由数据库驱动的网站自动生成。
比如这个典型的论坛URL:
http://www.example.com/viewthread.php?tid=12121&extra=page=3
百度等搜索引擎蜘蛛在发展初期一般不太喜欢爬行和抓取此类URL,原因在于极有可能陷入无限循环或收录大量重复内容,造成资源的极大浪费。
解决方法:
将URL静态化,严格说来应该是“伪静态化”。最常用的方法是使用服务器的URL重写模块,在LAMP(Linux+Apache+MySQL+PHP)服务器上一般使用mod_rewrite模块,Windows服务器也有功能类似的ISAPI Rewrite等模块。
 
2) 网站使用FLASH
虽然搜索引擎近些年来已经不断努力提高FLASH这方面的内容读取,但其抓取能力还有待考究。
解决方法:
建议将网站做成普通的HTML版本。如果实在到了非要FLASH不可的地步,不妨使用SWFObject和sIFR等便于搜索引擎抓取的技术。
 
3) 登陆后方可看内容
这部分需要填入登陆信息才能看到的内容,搜索引擎是看不到的。
解决方法:
可以适当将一部分内容公开化,方便搜索引擎抓取。其余内容使用登陆后方能查阅这种做法。
 
4) 强制使用Cookies
有些网页为了跟踪用户访问行为,启用了强制用户使用COOKIE的功能。如果用户的浏览器停掉COOKIE,页面的内容便会无法显示或者不能正常显示。这也会造成搜索引擎没有办法正常访问抓取。
 
5) 弹出的聊天窗口
显示在聊天窗口的内容,搜索引擎是也是无法读取的。
 
6) URL里含有Session ID,即(会话ID)
每个用户在访问网站时会有一个唯一的Session ID 存在于URL中。这会导致同个页面出现不同的URL的状况,导致搜索引擎认为网站有大量重复内容,这对网站来讲是极端不利的。
 
7) 搜索引擎所敏感的各种跳转
搜索引擎对一些类似于302跳转,Javascript跳转,Flash跳转,Meta Refresh跳转相对来讲比较敏感。如果必须要使用,推荐301跳转。
 
8) 网站的框架结构
虽然搜索引擎蜘蛛可以根据跟踪框架里所调用的HTML文件,然而通常情况下这些文件是不完整的,这导致搜索引擎无法判断框架中的内容到底是属于主框架还是框架调用的文件。
解决方法:
避免在建站时使用框架
9) Javascript 链接的使用
据了解,对于权重不高的网站,搜索引擎会认为没有必要浪费精力去执行脚本,跟踪链接的。所以做导航时,应该避免使用Javascript.

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有