当前位置:首页 > SEO网站 > 正文内容

关于网站robots协议,看这篇就够了

admin3年前 (2023-02-26)SEO网站356

robots是搜索引擎爬虫协议,也就是你网站和爬虫的协议。

简单的理解:robots是告诉搜索引擎,你可以爬取收录我的什么页面,你不可以爬取和收录我的那些页面。robots很好的控制网站那些页面可以被爬取,那些页面不可以被爬取。

主流的搜索引擎都会遵守robots协议。并且robots协议是爬虫爬取网站第一个需要爬取的文件。爬虫爬取robots文件后,会读取上面的协议,并准守协议爬取网站,收录网站。

robots文件是一个纯文本文件,也就是常见的.txt文件。在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。因此,robots的优化会直接影响到搜索引擎对网站的收录情况。

robots文件如下图

存放目录

robots文件必须要存放在网站的根目录下。也就是 域名/robots.txt 是可以访问文件的。你们也可以尝试访问别人网站的robots文件。 输入域名/robots.txt 即可访问。

robots写作语法

首先我们来看一个范例(下图)

user-agent这句代码表示那个搜索引擎准守协议。user-agent后面为搜索机器人名称,如果是“*”号,则泛指所有的搜索引擎机器人;案例中显示“User-agent: *” 表示所有搜索引擎准守,*号表示所有。

Disallow是禁止爬取的意思。Disallow后面是不允许访问文件目录(你可以理解为路径中包含改字符、都不会爬取)。案例中显示“Disallow: /?s*” 表示路径中带有“/?s”的路径都不能爬取。 *代表匹配所有。 这里需要主机。 Disallow空格一个,/必须为开头。

如果“Disallow: /” 因为所有路径都包含/ ,所以这表示禁止爬取网站所有内容。

如果没有被禁止到的路径,默认为可以被爬取。

关于robots的注意事项

1、不要禁止爬虫爬取网站的所有,因为从经验来看,如果屏蔽一次,解封后好一段时间爬虫都不会来你网站,收录成为问题。

2、代码后需要【冒号+空格+斜杆】 ,比如“Disallow: /*?* ”

3、当网站为静态路径时,需要屏蔽掉所有动态链接。网站中存在一种链接被收录即可,避免一个页面2个链接。代码如下“Disallow: /*?* ”表示禁止所有带 ?号的网址被爬取。通常动态网址带有“?”“=”等。

4、根据自己网站情况定,屏蔽不需要收录的网址。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=13105

分享给朋友:

“关于网站robots协议,看这篇就够了” 的相关文章

SEO为何会被贴上祸害互联网行业的标签

SEO为何会被贴上祸害互联网行业的标签

SEO,在国外是多么充满朝气的行业,而在国内,却变成了写垃圾文章,群发外链的代名词。很多人一听说SEO,就觉得我们只会在网上灌水,不断的制造垃圾,是一个垃圾行业,互联网就是被我们这样的人给搞混乱了。笔者王开新为此是感到痛心不已,原本我们是属于电子商务的范畴,是代表了国家互联网的未来,而因为种种原因,...

做好站内锚文本建设的方法技巧

做好站内锚文本建设的方法技巧

所谓的锚文本就是在html文档的链接标签中添加一些文字,使这些文字能够被用户点击后而跳转到特定链接上。现在,很多朋友认为百度算法不断削弱锚文本对排名的作用,应该放弃做网站锚文本。但是作者认为现在百度越来越重视用户体验,提升用户体验才是现在锚文本的真正价值。今天笔者就跟大家分享一下做好站内锚文本建设的...

META标签,html标签,META标签作用(图文详解)xooooo

META标签,html标签,META标签作用(图文详解)xooooo

META标签,是在HTML网页源代码中一个重要的html标签。META标签用来描述一个HTML网页文档的属性,例如作者、日期和时间、网页描述、关键词、页面刷新等。META标签元素可提供有关页面的元信息(meta-information),比如针对搜索引擎和更新频度的描述和关键词。META标签位于文档...

网站快照不更新的解决办法是什么

网站快照不更新的解决办法是什么

现在国内搜索市场真可谓是硝烟弥漫,几何时,百度是国内搜索行业公认的“大当家”,然而,随着互联网时代的不断发展,360搜索的横空出世,几大搜索的行业内战,使得搜索市场有了空前的转变。各大搜索引擎也不断推出新的算法,但是每一次算法更新都有很多网站中枪,要么是排名消失,要么是快照停止更新,收录下降。今天笔...

外贸网站SEO优化方案

外贸网站SEO优化方案

英文网站的SEO,目前是搜索引擎优化行业中,大家讨论的热点。SEO行业有大部分的技术人员是从事于英文外贸行业。英文网站的网站结构、URL优化、网站内容、关键词分析、链接相关性、整体标题等方面常见问题有什么解决方案?一、英文网站的结构优化:网站结构是SEO中比较重要的一点,网站结构的设计需要根据网站规...

SEO的页面标题和H1标签有什么区别?

SEO的页面标题和H1标签有什么区别?

SEO的页面标题和H1标签有什么区别?本指南带您了解页面标题和H1 标签之间的区别以及它如何影响 SEO。页面标题和 h1 标签之间的主要区别在于页面标题显示在浏览器窗口和搜索结果片段中,而 h1 标签仅显示在页面内容本身上。页面标题在 HTML 部分中定义,而 H1 标记是页面的一部分。在这篇文...