当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin3年前 (2023-03-09)SEO知识433

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

网站跳出率高应该如何解决

网站跳出率高应该如何解决

  当客户进入你的网站时,没有停留几秒就走了,这就是我们常说的跳出率高,那么是什么原因导致网站跳出率高呢?作为seo优化人员你就需要分析原因,提出解决方法。下面和大家详细聊聊。  一、网站弹出窗口过多。  当客户来到你的网站,想找到一个有用的资料时,忽然一个很大的弹出窗口发生在他的眼前,遮挡了他爱看...

自学SEO技术,怎样学才学的好「新手必看」

自学SEO技术,怎样学才学的好「新手必看」

​不管学习什么技术,也不管是参加培训还是自学,都还要看自己的自律性,乐建所认识的一些人中,有自学也有参加培训的,但是都没有学成,就是因为缺乏学习的自律性,很多人一直追求快速简单学习的教程,企图想通过又快又简又免费的途径提升自身价值,相信现实会给你一个狠狠的耳光的,那么作为SEO新人,如何正确的学好S...

SEO小白如何正确的学习SEO

SEO小白如何正确的学习SEO

之前学seo的时候,为了方便就加入了很多seo的学习群,基本全是各大培训机构的招生群,虽然广告比较多,但是为了所谓的seo大神技术还是潜伏了下来;从一开始所有问题都要请教大神到后来自己已经能够独立的做一批网站的优化之后,也算是经历了众多小白的必走之路吧,虽然现在不敢自称大神,但是从这段时间以来,做过...

黑帽seo都有哪些手法?

黑帽seo都有哪些手法?

很多人在做SEO的时候,都会尝试各种手段来提高网站的排名,其中包括了一些不正当的手法,也就是我们所说的黑帽SEO。黑帽SEO就是指那些利用不正当手段来提高网站排名的行为。这种行为往往会对搜索引擎本身和用户体验产生负面影响,并且这种行为还可能会被搜索引擎惩罚。下面笔者将为大家介绍一些常见的黑帽SEO手...

新手如何做好SEO?这三个技巧值得学习

新手如何做好SEO?这三个技巧值得学习

新手刚接触这个SEO行业总感觉有心无力,完全不知道从哪里下手,自己的网站每天都在更文章, 也有定期对网站进行维护,但是一段时间过来,网站的排名还是没有上去。今天我们就来聊一聊新手如何从这三个技巧入手做好SEO优化,让自己的网站排名不断上升。一、内容优化SEO首先,我们网站最重要的一部分就是内容,一般...

SEO布局是什么意思

SEO布局是什么意思

SEO布局 就是说 ,网站 优化布局。网站从建设,到内容填充,都要遵守 seo 优化这一策略。网站在建设开始,就要用 符合seo 的代码 ,标签 ,属性 。结构顺序。网站内部链接结构,内容的 填充。seo 布局 如果 往大了 ,往细了说 ,让要说 很长。一个真正的 seo , 布局如下: 网站代码优...