一、robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
二、robots.txt的基本写作语法
访问以上具体地址,我们可以看到robots.txt的具体内容如下:
User-agent: *
Disallow:
以上文本表达的意思是允许所有的搜索机器人访问www.probiz.com站点下的所有文件。
下面,再列举一些robots.txt的具体用法:
a、允许所有的robot访问网站所有的文件
User-agent: *
Disallow:
也可以建一个空文件 “/robots.txt” file
b、禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
C、禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
三、Robots META标签
Robots META标签的写法:
INDEX 指令告诉搜索机器人抓取该页面;FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;一共有四种组合:
1、<META CONTENT=”INDEX,FOLLOW”>
2、<META CONTENT=”NOINDEX,FOLLOW”>
3、<META CONTENT=”INDEX,NOFOLLOW”>
4、<META CONTENT=”NOINDEX,NOFOLLOW”>
其中
<META CONTENT=”INDEX,FOLLOW”>可以写成<META CONTENT=”ALL”>;
<META CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META CONTENT=”NONE”>

加载中…