我们首先要知道的就是自己的网站到底有多少张网页内容.网页是区分公开网页和秘密网页.
那些后台处理或者不想被人访问的网页称为秘密网页,一般情况下可以通过设置网站根目录下面的Robots.txt来限制有些网页不被收录,另外使用标签<meta
name="robots" content="noindex,
nofollow">也是限制收录的一种方法.
通常小型的网站我们是很容易知道网站有多少网页的,自己很容易数出来.但是如果碰到大型的,分布性网站(大型网站为了保证访问速度,会将服务器分布在不同的区域),这将是非常头疼的一件事情,比如新浪网.但是通常我们不需要得到特别精确的数据,只需要知道个大概数字就行了.你尝试过了计算总的网页数目了吗?有这么几种方法也许能给你思路:1
如果使用内容管理系统了,那么这里可能提供一个好依据.
2
在网站上释放自己的蜘蛛程序,比如免费的程序Xenu.(当然如果你的网站程序设计上阻止了其他搜索引擎,同样还是会阻止这个蜘蛛程序的)
3 自己数,哈哈
知道了网页的总数目后,就需要知道搜索引擎收录多少自己的网页.Google,Msn,Yahoo,Baidu都提供同一个命令来检查自己网站的收录数量:Site:xxx.com.我们可以在搜索引擎里输入指令来逐个检测.或者你也可以使用工具www.marketleap.com国外一个搜索顾问公司提供的,可以一次检查所有搜索引擎的工具.(国外有很多经营多年的搜索引擎的公司,他们自己开发了很多免费的工具供大家使用).
剩下的就很简单了,收录的也面除以网页总数,就得出了网站的收录率.您的是多少了呢?是不是太低了,那就赶快想办法吧...
加载中,请稍候......