当前位置:首页 > SEO网站 > 正文内容

建网站后正确快速识别百度蜘蛛只需从两方面下手

admin4年前 (2022-07-26)SEO网站643

我们在建网站后都比较关注网站的收录,跟网站收录息息相关的因素就是百度蜘蛛的抓取,因为我们更新网站内容后,只有被百度蜘蛛抓取后才有可能被收录。

那么,什么是百度蜘蛛?

在我们运营网站时又如何快速识别百度蜘蛛呢?

其实,我们可以把百度蜘蛛就是用来抓取网站链接的IP,经常会听到有站长朋友反馈百度蜘蛛来的太频繁,服务器要被抓爆了,如果你无法识别百度蜘蛛,你怎么知道是百度蜘蛛抓爆的呢?也有出现百度蜘蛛都不来了的情况,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP地址范围动态变化不固定,无法识别百度IP。

一、双向DNS解析认证

第一步:DNS反查IP

开发者通过对日志中访问服务器的IP地址运行反向DNS查找,判断某只spider是否来自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,非*.baidu.com或*.baidu.jp即为冒充。

根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

1).在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。

2).在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取。

3).在macos平台下,您可以使用dig命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取。

第二步:对域名运行正向DNS查找

对第一步中通过命令检索到的域名运行正向DNS查找,验证该域名与您日志中访问服务器的原始IP地址是否一致,IP地址一致可确认spider来自百度搜索引擎,IP地址不一致即为冒充。

示例1:

> host 111.206.198.69

69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com.

> host baiduspider-111-206-198-69.crawl.baidu.com

baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69

二、查看UA信息

如果UA信息不对,可以直接判断为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,这三个渠道UA分别如下:

移动UA:

Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

小程序UA:

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)

总之,正确快速的识别百度蜘蛛是我们做网站运营时必须要掌握的技能之一。

因为,只有了解的百度蜘蛛抓取网站的情况,我们才好进行针对性的完善网站。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=3091

标签: 百度蜘蛛
分享给朋友:

“建网站后正确快速识别百度蜘蛛只需从两方面下手” 的相关文章

网站seo优化过程中遇到的问题,网站不收录,网站被黑怎么解决

网站seo优化过程中遇到的问题,网站不收录,网站被黑怎么解决

对一位资深站长而言,SEO其实是相同的事情——基本优化、持续输出、质量、需求、内容、网站出现问题,都可以及时、有效地处理。但对刚接触SEO网站的新手来说,心中总有各种各样的问题,我的网站为什么不收录呢?假如网站遭到黑客攻击怎么办?检索索引和通信量有关吗?你是否有这些搜索优化期间的问题?当谈到收录问题...

如何让企业网站排名脱颖而出

如何让企业网站排名脱颖而出

大家都知道我们在做网站推广时需要一个积累的过程,作为一个站点,经过百度的考核、权重的积累、然后达到一个排名的理想位置这个是很多站长朋友梦寐以求的。但是很多时候我们往往事与愿违,今天笔者就跟大家分享一下如何让企业网站排名脱颖而出,希望对大家有所帮助。第一:做好网站基础优化笔者认为要想使企业网站的排名脱...

有大量未收录的文章会不会对关键词排名有影响

有大量未收录的文章会不会对关键词排名有影响

问题:有大量未收录的文章会不会对关键词排名有影响?回答:可以肯定,网站有大量未收录的文章对SEO有不好的影响!因为如果页面收录的比例很低,就意味着网站大部分内容是不合格的,这就直接影响到搜索引擎对于网站的评价,进而降低网站权重,减少展现等。大家要多去看看搜索引擎工作原理,了解搜索引擎的工作机制,这样...

keywords标签能为网站SEO带来什么

keywords标签能为网站SEO带来什么

keywords,翻译过来就是关键词的意思,然而在SEO中也起着重要作用,它是网站三标签中的其中一个,也是不可缺少的一个。对于用户来说它是在网站里查看不到的。keywords:其一是描述网站内容的核心主关键词(列举3-5个),其二是核心关键词是不是给用户看的,而是给搜索引擎蜘蛛看的,其三是对于SEO...

怎么优化自己网站的关键词_新网站seo必做步骤

怎么优化自己网站的关键词_新网站seo必做步骤

很多新手站长不知道怎样优化自己网站的关键词,不知道该从哪一步做起,今天就来给大家聊一下,新网站如何做好关键词的布局和优化工作。每一个步骤都很重要,希望大家认真看完。1、标签的配置关键词应该出现在网页标题标签。里面,标题标签Title Tag是目前很重要的一个因素,应该包含你最重要的关键词。另外在说明...

seo是什么?

seo是什么?

很多初学者刚接触seo时,在知道seo的含义之后,才能更好的去学习seo。那么,到底什么是seo呢,从官方的解读来看,Search Engine Optimization(搜索引擎优化),即seo搜索引擎优化。seo是基于搜索引擎营销的一种网络营销推广方式,通过使用seo技术,提升网站关键词排名和公...