当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin3年前 (2023-03-09)SEO知识367

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

关键词布局排名优化方法

关键词布局排名优化方法

网站优化的核心就是关键词排名的优化。做关键词排名的站外因素很大程度上是发外链即锚文本建设利用首页做企业网站目标关键词排名是核心的操作点。1、关键词布局关键词是网站优化排名的核心这是毋庸置疑的。因此一定要找出好的关键词并进行一个好的布局。先把自己行业相关的关键词找出来作为主关键词,主关键词建议找难度适...

对新网站优化需要注意哪些事项

对新网站优化需要注意哪些事项

做网站优化是一个比较辛苦的工作,尤其对于刚上线的新站来说,很多站长朋友面对一个新站的优化会显得无可下手。今天笔者就跟大家分享一下对新网站优化需要注意哪些事项,希望对大家有所帮助。第一:新站要重视网站域名和空间的选择新网站优化得好不好,域名和空间影响很大。一般来说,网站的域名最好选择COM、CN、NT...

SEO和SEM有什么区别?哪个更适合企业互联网转型?

SEO和SEM有什么区别?哪个更适合企业互联网转型?

这个问题拆分来看会比较有意义,放在一起会显得逻辑上不通顺。 分开来看这个问题: 1、SEM和SEM有什么区别? 简单来说,这是两种推广手段。seo更侧重于通过内容的优化、关键词的选择等方式提升自然流量。sem则是通过对广告账户的搭建、...

SEO站内优化教程附免费SEO辅助工具

SEO站内优化教程附免费SEO辅助工具

SEO站内优化教程附免费SEO辅助工具,SEO站内优化的重点不管是什么行业、什么工作、做什么事都有一个先后步骤,没有步骤的去做事只能是浪费时间,事倍功半,往往甚至适得其反走向反向道路,下面就来跟大家说说seo优化基本步骤由哪几方面构成。第一步:熟悉网站所属行业不管你作为什么层次的是SEO,在开始做网...

SEO该如何学习?

SEO该如何学习?

我是自学的,但学得不深,后面就转为整体线上营销了,可以把经历分享一下:转眼间,在教育培训行业市场营销岗位已经呆了近6年,从最先做SEO,到逐步接触活动、策划、渠道,一步步走来,有太多的感触值得和大家分享。(一)进入这个行业,来自于一次偶然。2010年,作为一名工科男,我抱着无知者无畏的心态去一家K1...

常见的黑帽SEO技术有哪些

常见的黑帽SEO技术有哪些

所有使用作弊或可疑手段的,都可称为黑帽SEO。其中步骤和过程比较复杂但是例如垃圾链接、隐藏网页、桥页、关键词堆砌等这些都不属于黑帽手段,只属于新手入门阶段。典型的黑帽搜索引擎优化,是用程序从其他分类目录或搜索引擎抓取大量搜索结果做成网页。seo技术一般分白帽seo、灰帽seo和黑帽seo。对于白帽s...