当前位置:首页 > SEO网站 > 正文内容

关于网站robots协议,看这篇就够了

admin2年前 (2023-02-26)SEO网站222

robots是搜索引擎爬虫协议,也就是你网站和爬虫的协议。

简单的理解:robots是告诉搜索引擎,你可以爬取收录我的什么页面,你不可以爬取和收录我的那些页面。robots很好的控制网站那些页面可以被爬取,那些页面不可以被爬取。

主流的搜索引擎都会遵守robots协议。并且robots协议是爬虫爬取网站第一个需要爬取的文件。爬虫爬取robots文件后,会读取上面的协议,并准守协议爬取网站,收录网站。

robots文件是一个纯文本文件,也就是常见的.txt文件。在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。因此,robots的优化会直接影响到搜索引擎对网站的收录情况。

robots文件如下图

存放目录

robots文件必须要存放在网站的根目录下。也就是 域名/robots.txt 是可以访问文件的。你们也可以尝试访问别人网站的robots文件。 输入域名/robots.txt 即可访问。

robots写作语法

首先我们来看一个范例(下图)

user-agent这句代码表示那个搜索引擎准守协议。user-agent后面为搜索机器人名称,如果是“*”号,则泛指所有的搜索引擎机器人;案例中显示“User-agent: *” 表示所有搜索引擎准守,*号表示所有。

Disallow是禁止爬取的意思。Disallow后面是不允许访问文件目录(你可以理解为路径中包含改字符、都不会爬取)。案例中显示“Disallow: /?s*” 表示路径中带有“/?s”的路径都不能爬取。 *代表匹配所有。 这里需要主机。 Disallow空格一个,/必须为开头。

如果“Disallow: /” 因为所有路径都包含/ ,所以这表示禁止爬取网站所有内容。

如果没有被禁止到的路径,默认为可以被爬取。

关于robots的注意事项

1、不要禁止爬虫爬取网站的所有,因为从经验来看,如果屏蔽一次,解封后好一段时间爬虫都不会来你网站,收录成为问题。

2、代码后需要【冒号+空格+斜杆】 ,比如“Disallow: /*?* ”

3、当网站为静态路径时,需要屏蔽掉所有动态链接。网站中存在一种链接被收录即可,避免一个页面2个链接。代码如下“Disallow: /*?* ”表示禁止所有带 ?号的网址被爬取。通常动态网址带有“?”“=”等。

4、根据自己网站情况定,屏蔽不需要收录的网址。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=13105

分享给朋友:

“关于网站robots协议,看这篇就够了” 的相关文章

常见的网站推广方式有哪些,各有什么优缺点

常见的网站推广方式有哪些,各有什么优缺点

做好企业网站的网络推广已经成为企业关注的焦点,各类各类推广的手段也被企业纷纷利用起来。现在很多公司都会选择付费的,因为效果最好,而且相对轻松很多,当然企业不同,所花费的费用也会不同,很多小公司是无法承担起巨大的广告费用的,而这时候就会选择一些免费的推广方式,今天比较就跟大家分享一下常见的网站推广方式...

SEO标题优化,怎么做?

SEO标题优化,怎么做?

在做网站优化的过程中,无论是网站首页标题,还是网站内页标题对于SEO优化来说,都有着非常重要的作用。标题就是网站的灵魂,标题的好坏不仅影响着用户的浏览体验,同时也会影响到网站的排名情况。因此,给网站设置一个优质的标题是非常重要的。那么,SEO标题优化,怎么做?1、标题中关键词的设置在做SEO标题优化...

SEO优化心得:规范化标签解决网站重复性内容索引难题

SEO优化心得:规范化标签解决网站重复性内容索引难题

在因特网上每天都有大量内容产生,有高质量内容也有垃圾内容,甚至是重复内容。如何让搜索引擎准确抓取真李逵而不是假李逵,避免抓取份额浪费呢?不难,网页添加规范化标签rel=canonical轻松解决。在本文中,你将了解到以下内容:1. 什么是规范化标签?2. 规范化标签在SEO中作用3. 规范化标签ca...

如何巧用SEO优化中的标签

如何巧用SEO优化中的标签

对于SEOer,在HTML代码中使用某些标签可以使搜索引擎蜘蛛更易于阅读,而适当地放置某些优化的标签可能会产生意外的结果。下面列出了一些标签的妙用。1.标题标签,在网页html代码中,标签是最大的定义标题建议标签在整个页面上只出现一次。—您可以定义标题。权重大小按最大顺序向后减小。除了标签以外,其他...

如何在DEDECMS织梦模板中调用全站相关文章?

如何在DEDECMS织梦模板中调用全站相关文章?

很多站长在使用DedeCMS搭建网站的时候,都希望能够在文章内容页底部调用几篇与本篇文章相关的文章,这样不但可以去除DEDECMS默认模版原有的生硬,增加美观度,而且对SEO优化和提升网站PV也有很大的帮助,织梦文章内容页默认模板缺少相关文章,对用户及搜索引擎查找及判断文章主题不利,那么,如何实现在...

网站中SEO优化的相关代码标签

网站中SEO优化的相关代码标签

昨天我们说到了网站中SEO优化的相关代码标签,今天我们就来详细的说一说网站中SEO优化的相关代码标签都有什么,又是如何使用的。h标签优化1、h标签分为h1-h6标签,h1-h6分为六个层级。权重依次递减2、h1标签是h标签中最重要的,也是赋予权重最高的,因为一个页面中只能出现一次h1标签,一般h1标...