在搜索结果中展示更好的页面标题

发表者:Pierre Far,网站管理员趋势分析专员
原文:Better page titles in search results

页面标题是搜索结果中的重要部分,因为它们是每项搜索结果的第一行字,同时也是用户点击进入网站的直接链接。一直以来,我们都建议网站管理员为他们的网站编写独特的描述性页面标题(以及页面摘要的元描述)向用户展示页面内容。

我们会采取许多方法决定将哪一个标题展示给用户,但如果网站管理员已明确指定,将主要取决于标题标签。对于某些页面来说,单一标题可能无法满足用户所有的查询需求,所以我们的算法库会自动产生出一些备选标题以便用户更轻松地识别相关页面。测试表明,这些备选标题通常更接近查询内容并且能够大幅度提高结果页面的点击率,对搜索用户和网站管理员都有帮助。

如果页面没有标题,或者网站管理员在HTML中规定采用非描述性标题时,也会有备选标题显示出来。比如,只用单词“Home”表示的标题就无法准确、全面地说明页面内容。我们常见的另一个问题是,网站管理员对网站内几乎所有页面都采用了相同的标题,有时候是完全复制,有时候仅做了微小改动。最终,我们还会采用简洁、描述性的备选标题替换冗长、难懂的标题。

为方便您更好地了解如何写好标题和元描述,以及我们采用的生成备选标题的具体方法,我们近期更新了此主题的帮助中心文章,供您参考。而且,当我们发现网站标题有待改进时,我们也会通过网站管理员工具中的HTML建议功能通知相关网站管理员。您可以在网站站长工具首页上,点击相关网站,然后在左侧菜单上点击故障诊断。

如果您有任何疑问或反馈,请在网站管理员帮助论坛上告诉我们。


网站诊断之建议篇

发表者:谷歌中文搜索质量团队

几周之前,我们曾邀请非营利性的公益网站站长向我们的搜索质量团队提交他们的网站,参加我们的在线网站诊断活动。感谢积极参加此次活动的公益网站站长!现在我们根据提交的网站,总结出了一些需要改进的地方,并提供了一些建议以及您可以从谷歌获得的资源。虽然本次网站诊断主要针对非营利性的公益网站,但我们相信我们提出的改进建议也会使其它网站受益。

1. 请开始使用谷歌网站站长工具
我们发现,有些网站从未使用过谷歌网站站长工具,也不知道这个工具的方便之处。谷歌网站站长工具能够就网页在Google搜索结果中的可见性为您提供详细的报告。这是一款自动升级的产品,为网站站长提供网站信息、帮助您自行处理多个请求。通过学习,您就可以自行完成许多任务了,比如:查看网站状态,了解您的网站链接,或清除网站上的恶意内容。因此,我们强烈建议您使用这一工具。开始使用前,您只需添加您的网站并进行验证。此外,我们还向您推荐这个视频,直观地介绍了如何使用这种工具,使其发挥类似于SEO(搜索引擎优化)的作用。

2. 改进您的网站标题
如果用户用Google搜索您的网站,他们可能会首先看到您的网站标题。标题是帮助Google和用户了解网站重要内容的最直接的途径。我们建议为网站的所有网页都配备一个实用、说明性强的标题,您可参考我们的帮助页面获取帮助。理想情况下,好的标题应包括机构名称和描述性标签。接下来,我们举部分已提交的网站为例说明:
示例:
1. 机构:橄榄树残疾人交流平台
标题:橄榄树残疾人交流平台
论坛 残疾人就业 残疾人交友、培训、孵化中心 关爱残疾人

2.机构:格桑花西部助学网
标题:格桑花西部助学网 - 格桑花教育救助会官方网站|慈善|结对|1对1|1+1

您可以看到,好的标题应包括机构名称和描述性标签。网站上的每一个网页都是与众不同的,所以应当为不同的网页创建不同的标题,彰显您网站的多元性。而且,这也有助于用户了解
此网页与网站中其他网页的不同之处。

3. 重视描述性元标签
网站标题标签与描述性元标签都是帮助提高网站在Google搜索结果中的可见性的简单易行的方法。它们可能会直接影响到您的网站被点击的可能性。不过,我们看到部分网站站长仍未能充分利用这些方法。此前,我们已经发布了一篇博客,讨论如何改进说明性元标签。关于这一点,我们再来看看已经提交的网站中一个很好的例子。

如果未采用描述性元标签,或元标签的内容不具相关性,Google将自动从网站内容中选择页面摘要。请注意,您可以通过多种策略选择页面摘要,因此,您的元标签描述最好内容丰富、真实可靠、与网站内容统一。

4. 充分发挥h元素的作用
查看网页的标题是Google搜索引擎算法确定网页内容的方法之一,它能帮助我们了解网页内容的优先属性。

标题中的
h元素让Google和用户快速了解您的机构和网站上面的重要信息。对于Google和用户而言,h元素编号越低,文本越重要,所以请充分利用 h1 标签的作用。即使您不了解 h1 标签的视觉渲染方式,您也可以改变它在您的CSS中的外观。

5. 在图像中使用alt文本
我们发现,许多公益网站都喜欢展示图片,但大部分网站都未能恰当地利用图像的alt属性。如果运用得当,这种属性不仅能够帮助Google理解您的图片,还可以帮助那些使用文本格式浏览器、访问受限或使用受限设备的用户理解您的图片。

请注意,如果您打算展示多幅图片,网速也有可能受到影响。此时恰当地运用alt属性将发挥重要的作用。理想的alt文本应当内容丰富,说明性强。

6. 告诉Google是否抓取:网站地图与robots.txt
在这次活动中,我们发现大部分已提交的网站都没有提供网站地图。创建并提交网站地图有助于确保Google了解您网站上的所有网页,包括那些可能不会被Google普通抓取流程发现的URL。就像我们建议您按照逻辑方式组织网页一样,以逻辑方式组织整个网站结构也同样重要,尤其是在必要情况下,提供站内相关文档的链接。

另一方面,许多公益机构都会涉及一些重要信息。针对这一问题,您可以创建一个适当的robots.txt文件,告诉Google搜索引擎不抓取这部分内容。

7. www 还是非www?
这是我们在已经提交的网站中发现的另外一个问题。对于有些网站,加了www就能正常运作,但是去掉www就无法打开。在这种情况下,我们建议您使用301重定向功能指向您的首选域名。您可以查看使用网站站长工具设置首选域的相关功能。

8. 使用正确的HTTP结果代码
另外一种常见的问题是很多网页返回错误的HTTP结果代码。有些网站的错误网页没有返回HTTP结果代码404,而返回了HTTP
成功代码200。只有确实可以访问的文档才应该返回HTTP成功结果代码200。如果网页已经不存在,应当返回代码404(表示“该页面不存在”)。您可以使用网站站长工具中的 Googlebot抓取方式功能、Live HTTP Headers Firefox 附加组件等第三方工具或web-sniffer.net查看所有URL的Header回应。

在参加这次活动的网站中,有一家网站由于正在进行网站维护而关闭。下面是这家网站的搜索结果:

是的,如果由于网站维护或出于法律或其它原因,您决定暂时关闭网站,那么您的网站应该返回503 HTTP 结果代码(表示“服务不可用”),以告知搜索引擎:网站是暂时关闭。此外,它还允许网站站长为访问者和抓取机器人提供网站开放并再次运营的大致时间。

9. 用户都喜爱速度快的网站。
我们发现大多数用户非常重视网站速度。如果浏览器需要很长时间才能打开您的网页,有的用户可能不会有耐心等待或浏览您的网站。为此,我们提供多种工具和建议,帮助网站站长了解并优化网站的性能。最简单的入门方法就是使用Page Speed Online,还有大受欢迎的网络版Page Speed Chrome 扩展。我们还拥有大量来自Google和其他网站的资源,可帮助加快您的网站速度,我们建议您阅读这篇文章。

另外,您还需要确保用户能够轻松、迅速地找到您的联系信息/志愿者/支持服务的信息。这次我们试图与部分已提交的网站取得联系,但我们发现需要很长时间才能找到他们的联系信息,所以要切记将此类内容置于主域名的醒目位置。

感谢所有提交网站参加这次活动的非营利机构!你们的辛勤工作使我们的世界变得更美好。我们很高兴能够为您提供帮助,并且希望这些建议和帮助能够使您受益。如果各位站长还有关于网站排名和收录的其它问题,请登录我们的网站管理员帮助论坛,提出您的问题与反馈。

最后祝大家春节快乐!



向您介绍智能手机Googlebot-Mobile

发表者:Yoshikiyo Kato,软件工程师
原文:Introducing smartphone Googlebot-Mobile

随着智能手机的快速普及,我们发现越来越多的网站正在为用户提供专供智能手机浏览的内容。现在,我们高兴地宣布,除此前的传统手机用户代理之外,Googlebot-Mobile现在也可以通过智能手机用户代理进行搜索。这项改进旨在提高我们对智能手机内容的覆盖率,并为智能手机用户提供更好的搜索体验。

以下是Googlebot-Mobile目前采用的主要用户代理字符串:

• 传统手机Googlebot-Mobile:
o SAMSUNG-SGH-E250/1.0 Profile/MIDP-2.0 Configuration/CLDC-1.1
UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 (compatible; Googlebot-Mobile/2.1;
+http://www.google.com/bot.html)
o DoCoMo/2.0 N905i(c100;TB;W24H16) (compatible; Googlebot-Mobile/2.1;
+http://www.google.com/bot.html)

• 智能手机Googlebot-Mobile:
o Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; en-us)
AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8B117
Safari/6531.22.7 (compatible; Googlebot-Mobile/2.1;
+http://www.google.com/bot.html)

智能手机网页抓取工具Googlebot-Mobile抓取的内容将主要用于改进移动用户的搜索体验。例如,新的网页抓取工具可能会发现专为智能手机浏览而优化设计的内容和目录。

我们推出的又一项新功能是重定向到为智能手机优化的网页。如果我们在搜索结果中发现,一个URL会将智能手机用户引向服务于智能手机优化内容的其它URL,我们将改变搜索结果中显示的链接,直接指向最终URL。这种功能消除了重定向带来了延迟,为用户节省了约0.5 - 1秒的网页访问时间。

所有Googlebot-Mobile用户代理都将自己定位为特定类型的移动端, 因此请采用与处理手机用户代理同样的方式处理Googlebot-Mobile请求。除了我们今天更新的有关智能手机的内容外,我们在上一篇博客中讨论的其他指南的详细内容仍然适用。如果您的网站设置认为Googlebot-Mobile只搜索传统手机用户代理,那么我们强烈建议您查看本策略,根据Googlebot-Mobile的用户代理提供相应的内容,以使您的内容对于传统手机和智能手机都能得到适当索引。

如有其他问题,请通过我们的网站管理员帮助论坛提出。


给托管服务商和网站管理员的一些建议

发表者:Pierre Far,网站管理员趋势分析专员
原文:Tips for hosting providers and webmasters

一些网站管理员在论坛上咨询影响他们站点托管的问题,为帮助托管服务商和站长们识别、诊断以及解决这些问题,我们与您分享一些常见的问题及解决方法。

• 拦截Googlebot 抓取功能。这是一个非常普遍的问题,通常因防火墙配置错误或DoS保护系统所致,有时也因站点运行的内容管理系统所致。保护系统是形成好的托管服务的重要组成部分,通过配置来拦截异常的服务器频繁的请求,但有时也可自动完成。然而Googlebot通常会执行比个人用户更多的请求,所以这些保护系统也会决定拦截Googlebot,并阻止其抓取您的网站。如需查验此类问题,您可以使用网站管理员工具中的Googlebot抓取方式功能,并查看网站管理员工具显示的其它抓取错误

我们向那些希望更有效地控制Googlebot抓取功能并提高抓取效率的网站管理员和托管服务商提供了几个工具:

o 我们就如何使用拒绝googlebot协议配置 URL 参数来控制“Googlebot抓取方式”功能提供了详细的帮助。
o 如果您担心使用Googlebot的代理程序,我们提供了一个方法来验证该抓取工具是否为Googlebot。
o 如果您想改变Googlebot抓取您的站点的频率,您可在网站管理员工具中验证您的网站,并且改变Googlebot的抓取速度。托管服务商也可验证他们IP地址的所有权。

更多信息请查询抓取和索引FAQ

• 可用性问题。我们常见的另一类问题是当Googlebot (及用户)试图访问站点时,网站无法浏览。这通常是由DNS问题、服务器过载引起的超时和拒绝链接问题、错误的内容分发网络配置(CDNs)、以及很多其它类型的错误造成的。当Googlebot遇到这些问题时,我们将之视为网址无法访问错误抓取错误并在网站管理员工具中报告该错误。

• 无效SSL证书。要想SSL证书对您的网站生效,必须将它们与站点名称相匹配。常见问题包括过期的SSL证书,以及因服务器上所有网站使用同一个证书而导致的服务器错误配置。在这些情况下,大部分浏览器会试图警告用户,Google则通过网站管理员工具发送一条信息来警告网站管理员。要解决这些问题,就要确保您所使用的SSL证书对所有网站的域名以及您用户访问的子域名都有效。

• 通配符DNS。网站可通过配置来响应所有子域名的请求。例如,example.com的网站可以通过配置用来响应来自foo.example.com,made-up-name.example.com以及所有其它子域名的请求。

在某些情况下,这是网站管理员所希望发生的,例如一个用户生成内容的网站可自行选择给予每个账户各自的子域名。但在某些情况下,网站管理员可能不希望发生这种行为,因为这也许会引起不同的主机名将内容进行不必要的复制,还可能影响Googlebot抓取功能。

若想尽量减少通配符DNS设置中的出现的各种问题,您可以将您的网站设置成不使用它们,或者将您的服务器设置成对不存在的主机名不能成功响应,亦或拒绝连接或直接返回HTTP 404 页面。

• 虚拟主机错误配置。这种问题的特征是同一个服务器上托管的多主机和/或域名总是只返回一个站点的内容。换言之,尽管服务器托管多个站点,但它不管请求内容是什么却只返回一个站点。要诊断此问题,您需要验证服务器是否正确地响应了HTTP 主页面。

• 通过特定的URL托管复制内容。很多主机基于测试/开发的目的,为您的网站提供URL。例如,如果您在托管网站example.com上托管http://a.com/,托管提供商可能会提供如 http://a.example.com/ 或 http://example.com/~a/这样的URL地址来作为您网站的入口。我们建议不要将这些特定的URL托管设置成可被公开访问的状态(通过密码保护它们);即便这些URL可被访问,我们的算法通常选择网站管理员所想要的URL地址。如果我们的算法选择特定的URL托管,您可通过正确执行规范化技术来对我们的算法做出改动,从而选择您首选的URL。

• 软错误页面。某些托管服务商用HTTP 200状态码(表示“成功”)而不是HTTP错误状态码来显示错误页面。例如,一个出现“页面无法访问”字样的错误页面可能会返回HTTP 200而不是404,从而造成软404页面;一条“网站暂时无法访问”信息返回的可能是HTTP 200,而不是正确地返回503HTTP状态码。我们努力检测软错误页面,但当我们的算法无法检测出主机软错误页面时,这些页面的错误内容可能被列入索引,导致分级或跨域选择网址的问题。

检测返回的状态码很简单:只需采用任一一种工具,如Googlebot抓取方式,查看服务器返回的HTTP页面。如果一个错误页面返回的是HTTP 200,那么我们可以改变配置使其返回正确的HTTP错误状态码。同样,请留意网站管理员工具软404报告中有关抓取错误页面的诊断方法。

• 内容修改和框架(frames)。网站管理员可能惊讶于看到页面内容被托管服务商修改,尤其是在页面插入脚本或图片。除此之外,主机还可能通过使用frames或iframe将内容嵌入其它页面来托管内容。如果想查看主机是否以您意料之外的方式修改您的内容,只需查看主机托管页面的源代码,并将其与您上传的代码进行比较。

请注意某些服务器端代码的修改可能非常有用。例如,一个使用Google Apache加速模块或其它工具的服务器可能会压缩代码来优化页面载入速度。

• 垃圾信息和恶意软件。我们经常看见有部分主机和大量子域名服务成为恶意软件和垃圾邮件的主要来源,鉴于此,我们进行一些细微的操作来保护用户和提高搜索质量,但如果我们发现特定的主机上绝大部分站点发送垃圾信息或传播恶意软件时,我们就不得不对整个主机采取行动。为帮您控制恶意软件,我们提供:
o 适用于托管服务商的网络管理员安全浏览警报
o 适用于个人网站的管理员工具的恶意软件通知
o 适用于开发人员的安全浏览API

我们希望以上几点能帮助托管服务商和网站管理员诊断和解决这些问题。除此之外,我们还在质量方面也有所思考,如服务的质量以及支持的有用性。如果您有问题或需要更多帮助,请咨询我们网站管理员帮助论坛


关于多语言内容的新标识

发表者:Christopher Semturs,软件工程师,搜索基础结构部,Google瑞士

原文:New markup for multilingual content

许多网站都为全球用户提供服务。针对用户使用的不同语言或所处的不同地区,每个网站都有不同的方式为用户提供合适的内容。去年,为了这样的网站能够支持用不同的语言模板呈现相同的内容,我们进行了详细的分析。如今,我们将对多语言内容的支持更进一步,提高处理以下两种情形的能力:

  • 多地区的网站使用相同的内容。如:澳大利亚、加拿大、美国的英文网页,它们仅仅在价格上有差别。
  • 多地区的网站内容完全是翻译过来的,或者不同的语言内容针对不同的地区。如:某一产品的网页有德语、英语和法语三个版本。

明确语言及位置

我们已经加强了对rel="alternate" hreflang link元素的支持,可以处理翻译的或者用于不同地理位置的内容。“hreflang”属性能够识别任一国家的语言,或者是相同内容的不同URL。通过识别这些供选择的URL,我们的目标是能够将这些网页的信息合并起来,为用户搜索提供适当的URL。这些供选择的URL可以在同一网站,也可以在另一个域名上。

注释内容相似的网页

对于那些在多个国家展示的,却有基本相同的语言和内容的网页。您可以选择用rel="canonical" link元素来指定您首选的版本。我们会使搜索集中在这个版本,同时为用户匹配当地的URL。例如,如果您已经拥有德文版的网站,而针对德国、奥地利和瑞士等不同地区的用户,用Google搜索相同产品时您都想呈现此页面,就可以使用这个方法。

范例

具体解释如何操作,我们来看一些URL实例:

  • http://www.example.com/——网站首页,西班牙语
  • http://es-es.example.com/——供西班牙用户使用的版本,西班牙语
  • http://es-mx.example.com/——供墨西哥用户使用的版本,西班牙语
  • http://en.example.com/—— 通用英语版本
在所有这些网页中我们可以使用以下标示来制定语言和选择地区:
<link rel="alternate" hreflang="es" href="http://www.example.com/" />
<link rel="alternate" hreflang="es-ES" href="http://es-es.example.com/" />
<link rel="alternate" hreflang="es-MX" href="http://es-mx.example.com/" />
<link rel="alternate" hreflang="en" href="http://en.example.com/" />

如果您想指定某一地区的子标签,我们会假定那是您的目标区域。

请记住所有注释网页都是以一对一的URL为基础的。请谨慎使用特定的URL,而不是首页,因为二者都可以链接到搜索内容。

更多帮助

如果您在运行多地区及多语言网站方面需要更多帮助,和往常一样,您可以浏览关于该主题的帮助中心文章并在我们的网站管理员帮助论坛上提问



谷歌分析现在提供网站管理员工具搜索查询数据

发表者:Christina Chen产品经理

原文: Webmaster Tools Search Queries data is now available in Google Analytics

今年年初,我们宣布以来自网站管理员工具的搜索查询数据为基础,对Google Analytics中的搜索引擎优化报告进行有限试点。通过从我们的试点用户那里获得的宝贵反馈信息,我们做出了几项改进,并高兴地宣布,谷歌分析的流量来源板块现在公开提供下列报告:

  • 查询:每天排名前1,000个查询的展示次数、点击次数、位置、和点击率信息
  • 登陆页面:每天排名前1,000个登陆页面的展示次数、点击次数、位置、和点击率信息
  • 地理信息摘要:按照国家划分的展示次数、点击次数、和点击率信息

所有的这些搜索引擎优化报告都可以为谷歌分析进行更深层次的数据分析提供先进的过滤和可视化功能。利用二级维度,您可以采用网站管理员工具目前无法提供的方式来查看自己网站的数据。


为使网站所有者启用这些搜索引擎优化报告,您必须是经过网站站长工具验证的网站所有者,也必须是该网页的谷歌分析管理员。一旦启用,管理员可以选择能够看到这些报告的帐户。

如果您有任何意见或建议,请登陆网站管理员帮助论坛,联系我们。



GET,POST以及安全获取更多网络信息

发表者: Pawel Aleksander Fedorynski 索引团队软件工程师;Maile Ohye 开发人员项目技术指导

随着网络的发展,谷歌的抓取和索引能力也需要与时俱进。我们改善了flash索引,建立了一个更加强大的Caffeine系统 我们甚至绘制了抓取表单。现在,特别当JavaScriptAJAX日渐普及后,我们发现越来越多的网页需要POST请求——因为网页的全部内容或因为有些网页信息缺失以及/或者POST无法返回资源而使网页无法显示。对于谷歌搜索来说,出现这一现象并不理想,因为如果我们没有正确地搜寻和索引内容,便无法呈现最全面、准确的结果。

通常情况下,我们建议使用GET来抓取网页所需资源,这是至今为止我们找到的最好的抓取方法。我们做过一些实验,将POST请求重新写入GET,在某些情形下,这是一种有效策略。一般说来,网络服务器从GETPOST返回的结果是完全不同的。另外,使用POST还有一些合理的原因(比如使用过程中,比起GET,在POST请求中可以附加的数据更多)。因此,虽然GET请求仍然更普遍,但为了从网页上获取更多内容,Googlebot会执行POST请求,因为我们认为它既安全又合适。

为了避免在网站上执行任务而导致用户任何意想不到的操作,我们采取了一定的措施。POST主要是用来抓取与网页自动请求相关的资源,模仿一个普通用户在浏览器中打开网址所看到的内容。随着时间推移,我们会逐步发现更好的模式,但目前我们还是用这一方法。

下面我们来看一些POST请求脚本,来说明我们如何随着网络的发展而改进信息抓取和索引功能的。

Googlebot的POST请求范例

  • 通过POST重新定位抓取一个网页信息
<html>
<body onload="document.foo.submit();">
<form name="foo" action="request.php" method="post">
<input type="hidden" name="bar" value="234"/>
</form>
</body>
</html>


  • 通过POST XMLHttp请求抓取一条资源
    在这个逐步进行的例子中,我们按照page renders产生的自动XMLHttp请求,既改善了页面索引又改善了其即时预览效果。

1. 谷歌抓取到网址,yummy-sundae.html.

2. 谷歌开始索引yummy-sundae.html,在此过程中,尝试渲染页面以便更好地理解内容以及/或者产生即时预览。

3. 在渲染过程中,yummy-sundae.html使用POST方法,自动发送一条XMLHttp请求资源,hot-fudge-info.html.


<html>
<head>
<title>Yummy Sundae</title>
<script src="jquery.js"></script>
</head>
<body>
This page is about a yummy sundae.
<div id="content"></div>
<script type="text/javascript">
$(document).ready(function() {
$.post('hot-fudge-info.html', function(data)
{$('#content').html(data);});
});
</script>
</body>
</html>

4. 通过POST请求得到的网址 hot-fudge-info.html,和其数据负载一起添加到Googlebot的抓取队列里。

5. Googlebot执行一个POST请求抓取hot-fudge-info.html网页信息。

6. 现在谷歌准确地呈现出一个可供即时预览的yummy-sundae.html网址。在某些情形下,我们还可以将 hot-fudge-info.htm网址内容合并在 yummy-sundae.html网址中。

7. 谷歌完成yummy-sundae.html网址的索引。

8. 用户搜索 [hot fudge sundae]

9. 现在谷歌算法能够更好地确定yummy-sundae.html与此请求的相关度,我们能够恰当地呈现网页快照来提供即时预览。

提高您网站的抓取和索引能力

在我们的网站站长工具帮助可以找到建立可抓取网页的常规建议。对于那些想帮助谷歌抓取和索引他们的网站内容以及/或者产生即时预览的网络管理员,以下建议可供参考:

  • 要获取资源,首选GET,除非有特殊原因需要使用POST

  • 确保我们可以抓取所需资源来渲染你的页面。在上面的例子中,如果hot-fudge-info.html无法获得robots.txt的允许,Googlebot便不能获取资源。更微妙的是,如果发出XMLHttp请求的JavaScript代码位于外部.js文件,无法获得robots.txt的允许,我们便不能看到 yummy-sundae.html hot-fudge-info.html两个网址的关联,所以即使hot-fudge-info.html网址本身不能获得允许,对我们也没有多大帮助。我们在纷繁的网络中甚至见到过更加复杂的相关性链接,允许Googlebot收集所有需要的信息有助于谷歌更好地理解您的网站。

    您可以通过网站管理员工具“实验室 -> 即时预览.”来检测资源是否被锁定。

  • 确保返回给Googlebot的内容和返回到用户浏览器的内容相同。隐藏真实内容(发给Googlebot的内容与发给用户的不同)违反了网站站长指南,因为,这会使我们向搜索者提供一个无关结果——用户在浏览器中看到的内容很可能与我们抓取和索引的内容完全不符。我们看到过许多POST请求的案例,网站管理员并无恶意的隐藏真实内容(这仍然是违反条例的),哪怕是最微小的改变,都会引起JavaScript错误,阻碍精确索引,且完全违背了最初隐藏真实内容的初衷。总的来说,如果你想让你的网站能够顺利索引,最好避免这种会引起麻烦的隐藏行为。

为了核实你没有不经意地隐藏真实内容,你可以使用网站管理员工具中的即时预览,或者在浏览器中将你的用户-代理字符串设置成如下:

Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)

如此改动后,网页应该没有任何变化。如果你看到一个空白页,JavaScript错误,或者如果页面有一部分消失或者出现变化,就存在问题了。

  • 切记将重要内容(比如你要索引的内容)记录在文本中,在页面上能一眼看到,不需要用户操作就能显示。大部分搜索引擎都是基于文本的,这样与基于文本的页面内容配合都能起到最好的效果。虽然我们一直在改进对各种格式的内容进行抓取和索引的能力,但是对于重要的信息来说,最好还是使用文本格式。

控制你的内容

如果你想要阻止网页内容被谷歌网络搜索抓取或索引到,最好的办法是用传统的robots.txt 文件指令。


未来趋势

我们将继续努力,使我们的检索更加全面,以便搜索者能查到更多相关信息。我们希望我们的收集和检索能力随着时间逐步提高,如同网络本身在不断提高一样。如有疑问或问题,请与我们联系。



Copyright © 2010 Google Inc. All rights reserved.
隐私政策 - 服务条款