为什么网站页面不收录?看大神分析百度蜘蛛Spider抓取篇
百度蜘蛛抓取策略中最主要方式有两种,一种是百度蜘蛛主动抓取发现新url,另外一种是站长通过资源平台主动提交链接,其中主动提交的数据最受百度算法青睐,对于普通网站运营来说,如果长时间不收录,建议 通过资源平台的API提交、普通提交让蜘蛛更快的发现数据。
那么从抓取环境来看,很多同学也做了提交,为什么还是看不到页面被收录呢?其实页面不被收录的因素很多,在抓取这个环节中,影响线上收录的因素有这几个:
1、robots封禁2、质量甄别3、抓取失败
很多CMS自带的都有robots.txt设置,一般情况下,用CMS自带的即可,由于项目的原因,很多人在线上运营之前都会选择禁用蜘蛛爬取,比如之前我们给客户做的网站中,上线后网站并没有完成,所以暂时封禁了蜘蛛,所以就用了以下这个代码:
User-agent: *Disallow: /
如果线上正式运营后,很多人忘记了更改回来,所以就导致了不被蜘蛛抓取,建议大家养成一个好习惯,不定期的检查robots设置,优化最合适的设置。
百度算法更新这几年,算法对低质量内容识别越来越精准,尤其是时效性内容,从抓取层面就进行质量评估,过滤掉低质内容,如果文章质量自己都看不下去,就不要再埋怨为什么不收录了。
百度蜘蛛抓取失败很多,其中最主要的原因还是服务器的问题,作为网站运营者时刻要关注服务器稳定情况,如果遇到打不开网站或者502错误,建议去服务器排查问题,增加防火墙设置等以保证网站稳定性。
以上3个方面是从百度蜘蛛角度去阐述网站页面不收录的原因,根据迅步的经验总结,最多的原因在于服务器不稳定导致的抓取失败,希望大家可以从这方面入手,加强服务器的稳定性。
最后,如果你对网站收录还有疑问的话,请看下一篇:为什么网站页面不收录?看大神分析文章内容质量篇!
“为什么网站页面不收录?看大神分析百度蜘蛛Spider抓取篇” 的相关文章
很多时候我们都很羡慕别人的网站打开速度快,网站排名好,我们在推广网站时比较关注的是文章和外链优化,而大部分人都忽视了网站代码优化。其实,网站页面代码经过优化后,一方面可以有效的精简页面中的冗余代码,加快页面的显示速度,同时降低页面占用搜索引擎服务器的存储空间,从而提高页面的用户体验,最终可以有效提升...
最近计划对网站的信息页进行改版,除了考虑用户体验,还需要考虑SEO相关因素。在诸多SEO相关因素中,HTML代码也是很关键的一环,有不少细节需要注意。但对于大多数前端工程师来说,通常都不了解搜索引擎优化,所以代码会出现一些SEO上需要避免的问题。前端常见HTML标签的SEO用法H标签H标签也叫做He...
文 | 陈老师来源:燃灯SEO课堂SEOer们都清楚,企业招聘SEO目的是什么?很简单,获得更多的网站流量,提高流量转换率,最终完成订单交易。然而,许多搜索引擎只专注于优化首页上的几个关键词,而内页上并没有优化的痕迹。只有一个结果,导致严重的两极分化。首页被撑起,内页永远吃不饱。很多热门的...
我们在推广网站时一提到链接,大家应该会想到文本超链接、图像超链接之类的。但是我们在对网站seo推广有过深入了解的人心中就会冒出这样的词:外链、内链、锚点链接、友情链接等等。今天就跟大家分享一下网站推广时不得不知的几种链接形式,希望对大家有所帮助。第一、网站内链1、什么是网站?链所谓网站?链是指在同一...
我们在做网站运营时都知道,网站内容是一个网站血液灵魂,网站内容的重要性自不多言,每个从事网站建设和网络推广营销的人都非常明白。很多时候我们为了使网站获得更好的排名,坚持不懈的用心原创,但是自己辛苦做的原创文章,被其他网站抄袭,抄袭后,排名还在自己网站的前面。面对这种情况作为站长朋友应该如何面对呢?今...
网站seo的本质是提升网站自身的价值,以便于网站在各大搜索引擎中取得好的排名。 网站seo有一个关键口诀,架构为城,内容为王,外链为皇,内链为妃,更新...