当前位置:首页 > SEO培训 > 正文内容

Robots.txt是什么意思,有什么作用

admin3年前 (2022-07-20)SEO培训456

搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。

spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。

您可以在您的网站中创建一个纯文本文件robots.txt,在文件中声明该网站中不想被robot访问的部分或者指定搜索引擎蜘蛛只收录特定的部分。

这里提醒一下,请注意:当你网站不希望搜索引擎全部收录时才用到robots.txt文件(比如你网站后台页面)如果你希望搜索引擎全部收录你的网站,请建立一个空的robots.txt文件。

1.首先告诉大家robots.txt文件要放在你网站的根目录里面。当你修改了你的robots.txt一般会在48小时内生效(对于搜索引擎来说)。

2.如果你要禁止搜索引擎在搜索你网站时显示快照,而只对你的网站索引,什么办呢? 百度支持通过设置网页的meta,防止搜索引擎显示网站的快照。方法如下:

要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 <HEAD> 部分:
<meta name=”robots” content=”noarchive”>
要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:
<meta name=”baiduspider” content=”noarchive”>

注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

3.我们来看一下如何写robots.txt,他的格式是什么样的。

该文本是以 User-agent: 作为文本记录开头的。这个值有什么样呢?它是来描述搜索引擎robots的名字。
比如说你要专指百度搜索引擎你就可以写为 User-agent: baiduspider
同样的谷歌就是 User-agent:googlespider  比如你要描述SOSO图片蜘蛛你可以写 User-agent:Sosoimagespider 这样都可以 如果你要针对所有搜索引擎呢 User-agent: *就是所有搜索引擎全部概括了。
robots.txt 除了第一项 User-agent: 还有其他两项 Disallow:   Allow: 但是User-agent: 是唯一项 他后面可以加若干Disallow和Allow行 也就是这种格式
User-agent: *
Disallow:
Disallow:
Disallow:
Allow:
Allow:
Allow:

后面加多少个Disallow和Allow行都可以 是根据你需要来加的。好了我接着说Disallow,该项就是告诉搜索引擎我不希望我网站的那些网页收录的。你就可以用Disallow的描述来限制搜索引擎 我们来举个例子,比如我要限制所有搜索引擎不收录我的后台目录admin那么我们什么做呢?来看一下
User-agent: *
Disallow:/admin/

如果是要显示百度不要收录我的这个目录其实搜索引擎可以什么做呢 前面我们说到了
User-agent: baiduspider
Disallow:/admin/

你问如果是要禁止所有搜索引擎访问全站应该什么办呢?我们来看一下
User-agent: *
Disallow:/

如果要禁止访问多个文件夹呢 比如我要禁止访问 Admin  image  data 3个文件夹
User-agent: *
Disallow:/Admin/
Disallow:/image/
Disallow:/data/

我们来解释一下Allow行是做什么的?其实这个Allow和Disallow是相反的。Allow他的意思就是希望搜索引擎访问我网站的一下路径,Allow通常与Disallow搭配使用。下面我们举个例子:
我要允许访问特定目录中的部分url 比如我不要他访问我Admin目录 但是我希望他访问我Admin目录里面的hdd.html 什么办呢?这时候我们就可以用到Allow了 来看例子
User-agent: *
Allow:/admin/hdd
Disallow:/Admin/

顺便所一下 在robots.txt里面可以使用”*”和”$”:baiduspider支持使用通配符”*”和”$”来模糊匹配url。
“$” 匹配行结束符。
“*” 匹配0或多个任意字符。

举个例子: 使用”*”限制访问url     。禁止访问/iea/目录下的所有以”.htm”为后缀的
URL(包含子目录)。
User-agent: *
Disallow:/iea/*.htm

再来举个例子 关于使用”$”限制访问url , 仅允许访问以”.htm”为后缀的URL。
User-agent: *
Allow: .htm$
Disallow: /

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=1125

标签: robots.txt
分享给朋友:

“Robots.txt是什么意思,有什么作用” 的相关文章

参加SEO培训需要什么基础知识?你如何知道SEO培训的基本知识?

参加SEO培训需要什么基础知识?你如何知道SEO培训的基本知识?

参加SEO培训需要什么基础知识?这句话基本上是许多SEO培训生关心的话题。这个问题不需要互联企业来回答。我相信你在网上知道很多。现在,让我们与数百名SEO学员在主流中讨论这个话题。许多人在认为SEO是项非常高的技术之前并不知道SEO.这是个非常严重的错误想法。事实上,学习SEO可以非常简单。切都很简...

如何从专业SEO的角度写网站标题

如何从专业SEO的角度写网站标题

在企业刚建立了企业网站后,网站的推广对网站尤为重要,网站推广要从优化中的D设置,毕竟网站的标题也是优先考虑的中心。使用标题优化关键字的技巧还有很多,如设计创意标题,高质量内容,关键字规划,描述链接,H标记等等,如果要优化标题关键字,先有一个优质内容和关键字规则等,但由于各大查找引擎都是经过网站的标题...

赶紧收藏!SEO培训班老师分享让SEO事半功倍的优化工具

赶紧收藏!SEO培训班老师分享让SEO事半功倍的优化工具

SEO优化培训老师提醒同学们想要做好SEO优化,除了从网站结构、内容建设、友情链接等多方面进行合理规划外,必须要借助一些有效辅助工具来提高SEO优化排名的效果。今天SEO优化培训老师整理了一些常用的SEO优化工具可以让同学们事半功倍,有效提升网站网页排名,使SEO优化更有成效。SEO事半功倍的优化工...

SEO主管篇:如何有效的培训合格的编辑

SEO主管篇:如何有效的培训合格的编辑

一个公司的网站编辑一般都是招聘上来的新人,没有多少编辑的经验。而一个好的编辑能让你的网站优化事半功倍,那么对于这个新人来说,我们seo主管都应该做哪些方面的培训呢?怎样才能培养出一个合格的编辑呢?那么seo践行者今天给大家从三方面分享一下这方面的内容。1、怎样创造有价值的内容一个合格的编辑,不是随便...

Seo优化-第一课01(价值万元培训班学习资料)

Seo优化-第一课01(价值万元培训班学习资料)

李佳骏上两篇文章简单介绍网络营销。下面是阿骏上seo优化培训班时候记得笔记,学seo首先要百度搜索引擎工作原理。(ps:第一次面试seo岗位,面试官问我的第一个问题就是百度蜘蛛是怎么爬的,瞬间懵懵,至今还留有阴影,知识点:百度蜘蛛,是百度搜索引擎的一个自动程序)。 学习目录...

seo做软文推广多久才会有效果(seo推广有效果吗)

seo做软文推广多久才会有效果(seo推广有效果吗)

软文营销怎么写?1、软文的形式:软文写出来是新闻 访谈 第三方评论更让用户容易接受。 2、软文内容:软文标题的策划、标题要新颖,让人一看就要过目不忘,充满诱惑;产品功能形象化 写作语言通俗化善于运用...