当前位置:首页 > SEO网站 > 正文内容

什么是Googlebot?

admin3年前 (2023-02-20)SEO网站512

Googlebot是Google的网页抓取工具的通用名称。具体而言,Googlebot是两种不同类型的抓取工具的通用名称:一个是模拟桌面设备用户的桌面版抓取工具,一个是模拟移动设备用户的移动版抓取工具。

您的网站很可能会被Googlebot桌面版和Googlebot智能手机版同时抓取。您可以通过查看请求中的用户代理字符串来确定Googlebot的子类型。不过,这两类抓取工具都遵循robots.txt中的同一产品令牌(用户代理令牌),因此您无法使用robots.txt有选择地指定Googlebot智能手机版或Googlebot桌面版。

如果您的网站已转换为采用Google的优先将移动版网站编入索引机制,那么多数Googlebot抓取请求都会通过移动版抓取工具发出,少数请求会通过桌面版抓取工具发出。对于尚未转换的网站,多数抓取操作则会通过桌面版抓取工具发出。在这两种情况下,负责完成少数抓取操作的抓取工具都仅会抓取负责完成多数抓取操作的抓取工具已抓取过的网址。

Googlebot如何访问您的网站

对于大多数网站,Googlebot的平均访问频率不会高于几秒钟一次。不过,由于存在延迟,在一小段时间内,此频率可能会略高一些。

Googlebot可在数千台计算机上同时运行,以提高性能并随着网络规模的扩大而扩展其作用范围。此外,为了降低占用的带宽,我们会在多台计算机上运行多个抓取工具,而这些计算机就位于它们可能会抓取的网站附近。因此,您的日志可能会显示来自多个IP地址的访问,且都使用了Googlebot用户代理。我们的目标是,每次访问您的网站时都尽可能多地抓取网页,但不会过多地占用服务器的带宽。如果您的网站跟不上Google的抓取请求频率,您可以请求更改抓取速度。

Googlebot会从美国境内的IP地址进行抓取。如果Googlebot检测到某个网站屏蔽了来自美国的请求,则可能会尝试从位于其他国家/地区的 IP 地址进行抓取。Googlebot当前使用的IP地址段列表以JSON格式提供。

通常,Googlebot会通过HTTP/1.1抓取内容。但是,如果网站支持HTTP/2并且通过HTTP/2抓取内容可能会使网站受益,那么Googlebot可能就会通过HTTP/2抓取该网站。这可能会为网站和Googlebot节省计算资源(例如CPU、RAM),但不会影响网站索引编制效果和排名。

如需禁止通过HTTP/2抓取,请对托管您网站的服务器做出以下指示:当Googlebot尝试通过HTTP/2抓取您的网站时,返回421HTTP状态代码。如果这种方法不可行,您可以向Googlebot团队发送消息(但这只是临时解决方案)

Googlebot可以抓取HTML文件或受支持的文本型文件中的前15MB内容。HTML中引用的所有资源(例如图片、视频、CSS 和 JavaScript)都是单独提取的。在抓取完该文件的前15MB内容后,Googlebot会停止抓取,并且只会考虑将前15MB的内容编入索引。文件大小上限适用于未压缩的数据。其他抓取工具可能有不同的限制。

禁止Googlebot访问您的网站

对于网络服务器,要想通过不发布指向它的链接来达到保密目的几乎是不可能的。例如,只要有人通过您的“私密”服务器上的链接访问了另一网络服务器,您的“私密”网址就可能会出现在引荐来源网址标记中,并可能会被所访问的网络服务器存储和发布在其引荐来源网址日志中。同样,网络中包含许多已过期和已损坏的链接。 只要有人发布了指向您网站的不正确链接,或未能成功更新链接以反映您服务器中的更改,Googlebot就会尝试从您的网站抓取不正确的链接。

如果您想阻止Googlebot抓取您网站上的内容,可以采用多种方法。请注意这些方法之间的差异,例如阻止Googlebot抓取网页、阻止Googlebot将网页编入索引以及完全阻止任何抓取工具和用户访问网页需执行的操作各不相同。

验证Googlebot

在您决定禁止Googlebot访问您的内容之前,请注意Googlebot所用的用户代理字符串经常会被其他抓取工具假冒。因此,请务必验证有问题的请求是否确实来自Google。若要验证请求是否确实来自Googlebot,最佳方法就是对请求的来源IP地址进行DNS反向查找,或将来源IP地址与Googlebot IP地址范围进行比对。

Googlebot抓取和索引哪些文件类型请阅读:Google(谷歌搜索)编入索引的文件类型

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=6593

分享给朋友:

“什么是Googlebot?” 的相关文章

中小企业在全网营销时代如何做才能吸引大量流量?

中小企业在全网营销时代如何做才能吸引大量流量?

伴随着新时代的不断发展,企业营销也进入到了全网营销的新时代。在新的时代要求下,各行各业的企业开启网络营销已经成为了不可逆转的趋势。然而,互联网时代的信息瞬息万变,想要通过网络营销实现企业口碑以及效益的提升并不容易。那么,作为中小企业在互联时代下要怎么做才能让企业网站能够独领风骚,排名靠前,吸引大量的...

建设推广企业移动手机网站应注意哪些要点?

建设推广企业移动手机网站应注意哪些要点?

现在随时移动互联网的快速发展,绝大多数的人们都离不开手机,除了工作和休息的时间,大概就把剩下的时间都耗在了手机上了吧!在这样的大趋势下,现在很多企业开始建设和推广自己的企业移动网站,今天就跟大家分享一下建设推广企业移动手机网站应注意哪些要点?第一:关于企业移动网站域名的选择其实,与PC网站一样,域名...

Seo优化中元标签的知识大全

Seo优化中元标签的知识大全

站内优化是SEO优化工作中的重点,不仅仅对排名起着非常重要的作用,更对用户的感官有着直接的影响。 设计良好的网站,能提高用户的粘性。对电子商务网站来说,设计良好的商城,能提高用户的转化率。 通常,网站内部优化主要包含元标签(TDK)的设计、关键词定位、...

手把手教你做好SEO

手把手教你做好SEO

乐天电商培训前言一个人只拥有此生此世是不够的。他还应该拥有诗意的世界。——王小波当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放蓝莲花音乐:许巍 - 时光·漫步一搜索流量优化的重要性1、京东搜索结果页数据统计分析关键词搜索结果页个排序方式入口:搜索不同排序方式入口下的流量占比搜索不同排序方...

网站被黑后正确处理的方法和技巧有哪些?

网站被黑后正确处理的方法和技巧有哪些?

大家都知道百度搜索引擎在每周和每个月都有一个固定的更新时间,在更新期间网站会遇到各种各样的问题,比如网站被黑。很多新手站长都遭遇过网站被黑客攻击的事情,很多人当遇到这样的问题的时候,不知道怎么解决,弄的焦头烂额的。今天笔者就跟大家分享一下网站被黑后正确处理的方法和技巧,以降低网站被K站或者降权的风险...

网站标题优化是搜索引擎优化的一部分

网站标题优化是搜索引擎优化的一部分

在当今数字营销时代,如何让您的网站在搜索引擎中排名更高?这是许多企业和个人都关心的问题。有些人认为,网站标题优化是SEO(搜索引擎优化)策略中最重要的一环;而其他人则认为,它只是SEO中的一个小部分。 那么,网站标题优化究竟属于搜索引擎优化吗?本文将深入探讨这个问题。...