加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

如何吸引百度蜘蛛的抓取

(2012-03-09 17:16:25)
标签:

搜索引擎

通道

蜘蛛

百度

seo

分类: 百度推广分析

    百度对于收录页面是通过网站入口URL的联通成一个网状,然后百度的抓取功能是被称为“百度蜘蛛”的工具在进行收集,那么这个百度蜘蛛的收集器就是网站页面收录的关键。怎么才能更容易的被百度蜘蛛发现与收录呢?百度蜘蛛的计算原理目前我的了解有限,百度蜘蛛并不是人,它没有思考能力,它只是根据命令与设定的规则来行动。

 

    据我经验了解百度蜘蛛的收录规则:

    1.原创内容

    这是唯一的最为重要的点,百度蜘蛛在每天每天的运作它会记录起所有的内容性质,那么在爬取的时候就会进行筛选,而第一无二的原创文章则是百度蜘蛛最喜欢的被称为“蜘蛛食量”。由于百度蜘蛛对内容是没有理解能力的,它只对词语进行判断,那么在题目与文章内容里我们就要增加词语的密度与联系。作为现在的百度来说相关度高的文章容易被收录。建议:如伪原创文章前200个字是蜘蛛判断是否原创的关键。

 

    2.蜘蛛通道的建设

    百度每天会发出很多的蜘蛛去收集内容供应搜索引擎的更新,那么百度蜘蛛的通道就是URL。蜘蛛通过搜索引擎的URL进行行动,那么我们网站就要给出大量的门让蜘蛛进入到网站来,尽量多的让蜘蛛带走我们的内容,那么那些地方才是蜘蛛喜欢去的呢?我们在选择做外链引蜘蛛的时候要考虑到,蜘蛛喜欢的是一些内容更新多,活跃度高的网站:例如(论坛,门户,社区等)。

 

    3.养蜘蛛

    这是很多SEO做的工作,养蜘蛛就是让百度蜘蛛喜欢网站,从而经常来网站,这样就能很好的收录网站内容。具体怎么做呢?根据蜘蛛的规则:原创文章、外部URL之外,这个更新时间与更新频率尤其重要,我自己的经验是每天早上8:30-10:30之间发布文章是非常好的,因为这样一天里就有尽量多的时间让蜘蛛接触新内容,方便蜘蛛抓取。更新的时候不要过于不定时的发,在更新时段里进行发布。在收录的快慢情况下,进行下一时段的发布,如果前面发布的文章很快被收录之后再下午3:00-5:00之后时在进行发布。我的了解是,一次性增加10-20篇文章是会出现漏洞的,就是蜘蛛只抓取一部分。坚持一段时间蜘蛛的抓取就能得以控制。在第一时段更新之后,发现没有被收录的文章,在第2时段前,我们可以进行修改,增取在第2时段被收录。

 

   这是酷猫我自己的经验浅谈,如果有更好的百度蜘蛛抓取规则,可以留言下来进行讨论。我网站的抓取还是不错的。留个入口:曾辉SEO

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有