当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin3年前 (2023-03-09)SEO知识541

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

SEO网站优化的优势大过竞价?怎么做才能实现网站排名?

SEO网站优化的优势大过竞价?怎么做才能实现网站排名?

SEO网站优化的益处远大于竞价这点是不可否认的。1、seo自然优化做上去的排名不同于竞价,每次点击都需要进行收费,而点击的费用高低又取决于同行的竞争压力,就好比去市场小摊卖水果,顾客一眼能看见的总共10个位置,愿意在这10个位置为了更好卖选择拿下集市门口最抢眼的那几个黄金位置,而偏偏这时又有很多家同...

做好这7个小细节,让SEO优化效果事半功倍

做好这7个小细节,让SEO优化效果事半功倍

网站SEO优化推广主要分为站内优化和站外优化,对网站内部的优化就叫站内优化。有很多站长一直在做SEO,结果到头来仍不知道站内优化要是做哪些工作?小编认为有以下7项工作必须要做。1、网站TDK的布局网站TDK的布局是整个网站的重中之重,包括栏目页以及内容页TDK的布局也是一样的,我们可以适当的添加关键...

百度搜索网页标题规范

百度搜索网页标题规范

对搜索用户来说,标题是一个网页最直观的认知渠道和展现方式,也是吸引用户点击搜索结果进入落地页的关键因素。 为了保障搜索用户对所需资源的有效获取,保证搜索结果的公平性,现百度搜索对外发布《百度搜索网页标题规范》,希望在满足用户需求的同时,为站长带来更多流量,实现共赢。...

建立高质量反向链接的10种方法

建立高质量反向链接的10种方法

多年来,搜索引擎优化和链接建设发生了重大变化。 随着技术的进步和用户对内容质量期望的提高,互联网的竞争变得更加激烈。 建立链接变得越来越具有挑战性,但它仍然是提高 Google 排名和在您的领域建立权威的有效方法。 当前的 2023...

如何挖掘网站seo优化关键长尾词分析

如何挖掘网站seo优化关键长尾词分析

一,使用工具查询索引对于不同的搜索引擎,关键词的竞争力可能是不同的。以百度搜索引擎为例。其产品中有关键字索引查询工具,可以在百度搜索引擎中快速查询关键字。的索引情况,可以了解用户近期一段时间对该关键字的查询和搜索情况。一般来说,30天内关键词索引少于500的关键词是容易SEO优化的关键词。对于索引在...

站内SEO优化---最全指南

站内SEO优化---最全指南

小汪跟着Leizi老师学习已有三个多月的时间了,在这期间小汪学到了许多网站SEO优化的知识,这一期,小汪就将自己学到的SEO优化知识分享给大家,期望对大家的网站优化能够起到帮助。本期的内容较多,建议观看的朋友们点个收藏后再浏览,不然以后找不到了~关键词:网站的内容是否完全满足用户的搜索意图用户能够点...