如何创建一个方便 Google 收录排名的网站?
(2009-02-03 17:20:06)
标签:
it |
分类: 网站推广 |
网站准备就绪后:
•
•
•
•
•
设计与内容指南
•
•
•
•
•
•
•
•
•
技术指南
• 由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可以使用 Lynx 之类的文本浏览器来查看您的网站。如果因应用了 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。
• 允许搜索漫游器在不采用会跟踪其在网站上浏览路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
• 确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。
• 利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录能够抓取,哪些不能抓取。确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。请访问http://www.robotstxt.org/wc/faq.html ,了解如何在漫游器浏览您的网站时对其进行指示。您可以使用 Google 网站管理员工具中的 robots.txt 分析工具测试 robots.txt 文件,以确保正确使用此文件。
• 如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。
• 使用 robots.txt 可避免抓取搜索结果页或其他自动生成的页面,这些页面对来自搜索引擎的用户没有太多附加值。
质量指南
上述质量指南介绍了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。
如果您认为其他网站正在滥用 Google 质量指南,请通过 https://www.google.com/webmasters/tools/spamreport?hl=zh_CN 举报。Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。我们收到的滥用行为报告将用于创建灵活的规则系统,以便于识别并阻止以后的滥用企图。
质量指南 - 基本原则
•
•
•
•
质量指南 - 具体指南
•
•
•
•
•
•
• 请不要专门针对搜索引擎创建"桥页",或使用其他联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。
如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特且相关的内容,使用户有理由首先访问您的网站。
向访问者提供他们要查找的信息
在网页上提供高品质的内容,尤其是主页。这是您要做的最重要的工作。如果您的网页包含有用的信息,其内容就可以吸引许多访问者并使网站管理员乐于链接到您的网站。要创建实用且信息丰富的网站,网页文字应清晰准确地表述要传达的主题。想一想,用户会使用哪些字词来查找您的网页,然后尽量在网站上使用这些字词。
确保有网站链接到您的网站上
链接可帮助我们的抓取工具找到您的网站,并提高您的网站在我们的搜索结果中的展示率。返回搜索结果时,Google 会配合使用 PageRank(我们对网页重要性的评测)与先进的文字匹配技术,对每个搜索结果都显示兼具重要性与相关性的网页。Google 会计数网页收到的投票数量,作为 PageRank 的评判标准之一,其计算方法是将从网页 A 指向网页 B 的链接计为由网页 A 对网页 B 所投的一票。本身很"重要"的网页所投的票会更具分量,且有助于提高其他网页的"重要性"。
请注意,我们的算法可区别自然链接与非自然链接。指向您网站的自然链接是当其他网站发现您的内容具有价值并认为其可能对访问者有所帮助时,在网络的动态生成过程中形成的。指向您网站的非自然链接是专门放在那里,使您的网站显得更受搜索引擎欢迎的链接。我们的网站管理员指南介绍了一些此类链接(例如,链接方案和桥页)。
只有自然链接对网站的索引和排名有帮助。
让您的网站易于访问
以合理的链接结构建立您的网站。每个网页应至少可以通过一个静态文本链接打开。
使用文本浏览器(如 Lynx)检查您的网站。大部分 Spider 查看网站的方式与 Lynx 一样。如果因应用了 JavaScript、Cookie、会话 ID、框架、DHTML 或 Macromedia Flash 等技术,而造成在文本浏览器中无法看到整个网站,则 Spider 在抓取此网站时可能也会遇到麻烦。
考虑创建动态网页的静态副本。虽然 Google 索引中包括动态网页,但它们只占索引的一小部分。如果您怀疑您动态生成的网页(例如包含问号的网址)给我们的抓取工具带来了麻烦,可以为这些网页创建静态副本。如果要创建静态副本,不要忘记将动态网页添加到您的 robots.txt 文件,防止我们将其当成重复内容。
需要避免的事项
不要使用关键字填满网页、尝试"遮蔽"网页或建立"仅供抓取"的网页。如果您的网站上包含您不希望访问者看到的网页、链接或文字,Google 会认为这些内容具有欺诈性并可能忽略您的网站。
合法的搜索引擎优化咨询公司可以改善您网站的流量和内容,但某些公司会采用欺骗性手段试图骗过搜索引擎。请务必小心,如果您的域名与这些欺诈性服务相关,我们可能禁止其加入我们的索引。
不要使用图片来显示重要的名称、内容或链接。我们的抓取工具无法识别图形中所含的文字。如果网页上的主要内容和关键字不能以普通的 HTML 格式显示,请使用 ALT 属性。
不要为不同网址下的一个网页创建多个副本。许多网站提供纯文本或易于打印的网页,其内容与相应的图形丰富的网页不相上下。为了确保您首选的网页包括在我们的搜索结果中,请使用 robots.txt 文件拦截 Spider 抓取到的重复内容。有关使用 robots.txt 文件的详情,请访问关于拦截 Googlebot 的信息。
转自Google问题解答