时 间 记 忆
最 新 评 论
专 题 分 类
最 新 日 志
最 新 留 言
搜 索
用 户 登 录
友 情 连 接
博 客 信 息


 
允许搜索漫游器抓取您的网站 
[ 2007-2-22 23:07:00 | By: google ]
 

技术指南

由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可使用 Lynx 一类文本浏览器来检查您的网站。如果因应用了 Java、、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。
允许搜索漫游器抓取您的网站,同时不采用会话 ID 或参数跟踪其在网站上的浏览路径。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。
利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具可以抓取哪些目录。确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。请访问 http://www.robotstxt.org/wc/faq.html,了解如何在漫游器浏览您的网站时对其进行指示。您可使用 Google Sitemaps 中的 robots.txt 分析工具测试 robots.txt 文件以确保正确使用该文件。
如果贵公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。
质量指南

上述质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。

如果您认为其他网站正在滥用 Google 质量指南,请通过 http://www.google.com/contact/spamreport.html 举报该网站。Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。我们收到的垃圾邮件报告将用于创建灵活的算法以识别并阻止以后的垃圾邮件。

质量指南 - 基本原则

设计网页时该考虑的是用户,而不是搜索引擎。不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种。这种做法通常称为"隐藏"。
请不要为了提高搜索引擎排名而弄虚作假。一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助?如果不存在搜索引擎,我是否还会这样做?"
请不要参与旨在提高您的网站排名或 PageRank 的链接方案。尤其要避免链接到违禁的网站或"恶邻",因为您自身的排名可受到这些链接的负面影响。
请不要使用未授权的计算机程序提交网页、检查排名等。这些程序会耗用计算机资源并违反我们的服务条款。Google 不建议使用 WebPosition Gold? 这类产品向 Google 发送自动查询或用程序编写的查询。
质量指南 - 具体指南

请不要使用隐藏文本或隐藏链接。
请不要采用隐藏真实内容或欺骗性重定向手段。
请不要向 Google 发送自动查询。
请不要使用无关用语加载网页。
请不要创建包含大量重复内容的多个网页、子域或域。
请不要创建安装病毒(如,特洛伊木马)或其他有害软件的网页。
请不要采用专门针对搜索引擎制作的"桥页",也不要采用如联属计划这类原创内容很少或几乎没有原创内容的"俗套"( cutter) 方式。
如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特而相关的内容,使用户有理由首先访问您的网站。
如果网站不符合我们的质量指南,则该网站可能会排除在索引之外。如果您断定您的网站不符合这些指南,可进行修改使其满足要求,然后申请重新加入。

 
  • 标签:搜索 漫游 抓取 网站 
  • 发表评论:

      大名:
      密码:
      主页:
      标题:
    七彩博客 网站建设 七彩社区 信阳毛尖 鲜花礼品 留学信息 网页设计 七彩鲜花 商标注册
    英国留学 建网站 打包带 工艺品 杭州鲜花 卓迈国际律师 Spa水疗 祝福短信 情人节鲜花 Nike shoes