当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin2年前 (2023-03-09)SEO知识272

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

SEO和SEM的区别

SEO和SEM的区别

随着数字营销的崛起,出现了大量的首字母缩略词和互联网术语。因此,看到 SEO 和 SEM 等术语时,我们可能在想它们究竟是什么意思。其实SEM代表搜索引擎营销,而SEO是指搜索引擎优化,严格意义上讲,SEM包含SEO,只不过现在大多数互联网从业人员更喜欢称SEM为竞价广告(下文会提到PPC广告:点击...

SEO和SEM主要区别

SEO和SEM主要区别

SEO也叫搜索引擎优化,是指遵循搜索引擎规则对网站进行优化,比如网站结构、网站代码、网站内容、网站内外链等等,以整体提升网站的权重和排名,更好的展示在搜索引擎首页,获取更多的曝光。SEM也叫搜索引擎营销,是按点击的一种付费广告,通过购买相关关键词,并投放在搜索引擎上增加曝光,当用户搜索购买关键词时,...

SEO站内优化需要关注什么,如何做好?

SEO站内优化需要关注什么,如何做好?

网站建设离不开SEO优化,SEO优化就是在了解搜索引擎自然排名机制的基础上,对网站进行内外部的整体优化,从而提升网站在搜索引擎中的自然排名,达到网络营销的目的。我们知道了SEO优化分为站外优化和站内优化,其中站外优化也就是做外链的发布和管理,那么SEO站内优化需要做什么,哪些方面是需要关注的呢?这篇...

如何自学SEO?

如何自学SEO?

先临摹。SEO 没什么理论,有效的都是实践中总结出来的结论。如果你是电商,就去看和你品类相似的网站的产品页 Html 是怎么写的,产品目录怎么映射到了网站结构上。死盯他们的新产品上线后页面的调整过程,把核心词,相关词一遍一遍放在搜索引擎里去验证。临摹到位了,多数情况什么也不会发生,你的网站排名不可能...

做SEO有前途吗(2025年做SEO还有没有前景)

做SEO有前途吗(2025年做SEO还有没有前景)

SEO有前途吗?最近有很多人、又开始叨叨上了。记得2025年我刚做SEO那会、就有个好大哥告诉我:兄弟,不要干SEO了,SEO这个行业没有前途了,换行吧。一、SEO已死几年了、各位还不是在做SEO?本来想听好大哥的话来着、尝试了几个行业、发现完全干不了,又开始搞上了SEO,这一搞,就是8年。去年有人...

提高网站文章收录需要注重文章细节

提高网站文章收录需要注重文章细节

很多时候我们做网站推广就是做网站内容,增加网站收录量。无论百度算法如何更新,提高用户体验,为用户提供有价值的信息才是网站赖以生存的根本。一个网站被百度收录的比率越高,那么流量就会越多,也就说明这个网站优化水平越好。那么提高网站文章收录需要注重文章哪些细节呢?第一:更新网站内容时要编辑相关度高的文章不...