当前位置:首页 > SEO网站 > 正文内容

关于网站robots协议,看这篇就够了

admin3年前 (2023-02-26)SEO网站329

robots是搜索引擎爬虫协议,也就是你网站和爬虫的协议。

简单的理解:robots是告诉搜索引擎,你可以爬取收录我的什么页面,你不可以爬取和收录我的那些页面。robots很好的控制网站那些页面可以被爬取,那些页面不可以被爬取。

主流的搜索引擎都会遵守robots协议。并且robots协议是爬虫爬取网站第一个需要爬取的文件。爬虫爬取robots文件后,会读取上面的协议,并准守协议爬取网站,收录网站。

robots文件是一个纯文本文件,也就是常见的.txt文件。在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。因此,robots的优化会直接影响到搜索引擎对网站的收录情况。

robots文件如下图

存放目录

robots文件必须要存放在网站的根目录下。也就是 域名/robots.txt 是可以访问文件的。你们也可以尝试访问别人网站的robots文件。 输入域名/robots.txt 即可访问。

robots写作语法

首先我们来看一个范例(下图)

user-agent这句代码表示那个搜索引擎准守协议。user-agent后面为搜索机器人名称,如果是“*”号,则泛指所有的搜索引擎机器人;案例中显示“User-agent: *” 表示所有搜索引擎准守,*号表示所有。

Disallow是禁止爬取的意思。Disallow后面是不允许访问文件目录(你可以理解为路径中包含改字符、都不会爬取)。案例中显示“Disallow: /?s*” 表示路径中带有“/?s”的路径都不能爬取。 *代表匹配所有。 这里需要主机。 Disallow空格一个,/必须为开头。

如果“Disallow: /” 因为所有路径都包含/ ,所以这表示禁止爬取网站所有内容。

如果没有被禁止到的路径,默认为可以被爬取。

关于robots的注意事项

1、不要禁止爬虫爬取网站的所有,因为从经验来看,如果屏蔽一次,解封后好一段时间爬虫都不会来你网站,收录成为问题。

2、代码后需要【冒号+空格+斜杆】 ,比如“Disallow: /*?* ”

3、当网站为静态路径时,需要屏蔽掉所有动态链接。网站中存在一种链接被收录即可,避免一个页面2个链接。代码如下“Disallow: /*?* ”表示禁止所有带 ?号的网址被爬取。通常动态网址带有“?”“=”等。

4、根据自己网站情况定,屏蔽不需要收录的网址。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=13105

分享给朋友:

“关于网站robots协议,看这篇就够了” 的相关文章

建设企业官网的基本流程和要注意的事项

建设企业官网的基本流程和要注意的事项

对于一个企业来说建设企业官网以及成为必不可少的选择,因为企业官网可以提高企业的品牌形象,挖掘自己的市场以及在网络中多一个渠道拓展自己的业务范围,还能够在一定的程度上面吸引自己的精准客户群体,传播自身在互联网中的搜索曝光率,提升自己的转化率。那么,我们如何在众多网站中脱颖而出呢?今天就跟大家分享一下建...

在网站网页设计时,要避免跳进这些常见误区的坑里

在网站网页设计时,要避免跳进这些常见误区的坑里

提起网页设计大家都知道是一个棘手的话题,同时网页设计对网站后期推广运营也起着至关重要的作用。因为,合理、简洁美观的网页设计就是对搜索引擎发出友好的信号,也方便蜘蛛爬行抓取。好的网页设计不仅要符合搜索引擎还要为用户量身定制,提高网站用户验度,这是为网站后期运营做好第一步重要的基础。所以,每个网页设计师...

提升网站排名,SEO优化至关重要

提升网站排名,SEO优化至关重要

如果一个网站想要长期发展,首先要注意的是排名。SEO优化可以提高网站的排名,所以SEO优化非常重要。但是SEO优化不是一蹴而就的,涉及到非常复杂的内容。实现网站优化的过程主要包括三个环节:一、网站内部优化对于提高网站排名非常重要1.优化META标签:内容标题。关键词和内容摘要都是标签优化的目标。2....

新网站将SEO关键词排名排进第一页,到底要花多久?

新网站将SEO关键词排名排进第一页,到底要花多久?

1、新网站的初始排名比较靠后有操作过大权重网站的应该都有经验,只要文章写得不差,几乎文章一被索引就能出现在第一页,而新网站则会出现在2x名以后。2、新网站的排名速度,只慢了2~3个月依照这个实测结果,虽然用新网站操作关键词排名的初始排名很靠后,但大多数的关键词都能在三个月内排上第一页(月搜寻量在10...

搜索引擎SEO优化常见的几个错误

搜索引擎SEO优化常见的几个错误

对于任何一个网站优化人员而言,都是会有一个成长的过程,特别是在做企业搜索引擎SEO优化的时候,总是走一些弯路,这让刚入职的SEO人员,非常苦恼。甚至根本不清楚自己什么地方有问题,并且在长期延续这种错误,而当作为SEO机构诊断的时候,往往徒增非常多的困难。以下就是搜索引擎SEO优化常见的5个错误:1....

什么?如何让你的标签在SEO中起到作用

什么?如何让你的标签在SEO中起到作用

内容必须有用且独特,才能吸引目标受众。但如果它不能被看到,人们甚至永远不会知道你独特的,有用的内容。因此,在你能让你的受众看到之前,搜索引擎需要先看到。为了吸引搜索引擎展现你的内容,需要考虑一下你的页面名称。在HTML代码中,页面名称以的形式显示,由搜索引擎机器人扫描,并且是搜索引擎结果页面上最可见...