当前位置:首页 > SEO培训 > 正文内容

搜索引擎爬虫对网页的三种更新策略

admin4年前 (2022-07-29)SEO培训510

  很长一段时间以来,成都SEO一直围绕着爬虫抓取来讲述相关的信息,今天成都SEO将与大家分享搜索引擎抓取更新的三种策略。

  搜索引擎爬虫的更新主要应用于快照等更新,以及搜索引擎对搜索页面的爬网行为。至于为什么要重新爬网,基本上是因为互联网上有数以万亿计的页面。许多页面在不断变化。这个不断变化的前置因素导致爬网程序不断更新自己的数据,因此它必须重新爬网已爬网的网页。那么搜索引擎爬虫的三大更新策略是什么?

  搜索引擎爬虫历史更新策略

  所谓的历史更新策略是为已被爬网的网页设置重新爬网的时间限制。例如,爬虫对我的SEO博客主页进行爬网,搜索引擎通过爬网获得我的博客主页。爬虫的爬行策略被调整为每3天访问一次我的博客主页。

  这种更新爬行策略告诉我们,网页中的频繁更改将导致蜘蛛频繁爬行。如果你的页面都是静态的。这意味着,如果不重新生成相应的页,则不会对其进行更改。相对而言,你不太擅长这种策略逻辑。因此,URL被设置为伪静态。在网站开放速度可控的前提下,将网页本身设置为动态页面是一个不错的选择。

  搜索引擎爬虫的用户体验更新策略

  所谓用户体验网页更新策略,是指搜索引擎认为网页参与具有一定的搜索量词排名,前三页是用户经常访问的网页。然后我们应该优先对这些页面的更新进行爬网。

  对于3页之后的用户,访问的人很少,以后更新也不错。因此,采用了一种web爬行更新策略。

  这个策略让我们知道,一些核心关键字排名较高的网页更经常被爬虫程序爬网。那么一个值得思考的问题是,网站也会有一些细节页面、聚合页面,甚至文章页面参与错别字的排名。这是否意味着这次的页面爬网量不错?针对这个问题,成都SEO此前通过对访问日志的分析,确定了这个答案。在80%的案例中,确实如此。但是,这些页面的频率远低于主页、频道页面和其他更靠近主页且路径更短的页面。

  但是,我们仍然可以优化详细信息页/文章页,以便在此类页上显示最新内容,并增加爬网程序条目以包含最新内容。

  搜索引擎爬虫抓取网页的抽样聚类策略

  说到这个策略,我们首先从字面上看“抽样,聚类”。抽样是指从网站上抽取一些样本进行观察,聚类就是根据这些样本的观察结果得出一定的结论后应用这种类型。

  我们的网站由不同的类型组成,如列表页面、产品详细信息页面、文章页面、频道页面、聚合页面等。这些都是不同的类型。搜索引擎从中间选取一些样本,观察并获得更新周期,应用于整个类型的方法是抽样聚类的web爬行更新策略。

  我们举个例子。搜索引擎通过从列表页中取样来查找A列表页。通过分析和观察,发现A列表页面可以每2天进行一次爬网。然后有与A列表页类型相同的B、C和D列表页,因为它们具有相同的模板、导航,并且第一页上的模块也指这四个列表页。然后它们是相同类型的,所以B、C、D列表页与A列表页相同,并且它们在2天内被获取。

  好吧,今天的分享就在这里,希望能帮助你,如果有任何问题,请留言给我。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=3870

分享给朋友:

“搜索引擎爬虫对网页的三种更新策略” 的相关文章

反向链接Backlinks是什么?会影响SEO排名吗?

反向链接Backlinks是什么?会影响SEO排名吗?

反向链接,英文名称叫做Backlinks,是指外部网站的某个页面,给了一条超链接连到你的网站的某个页面。反向链接在中文SEO 圈又常被叫做外部链接,但根据Backlinks英文名称,叫反向链接或许比较洽当,也比较不会跟外链接(自家链接连到别人网站的链接)搞混。反向链接会影响SEO 搜寻引擎优化的关键...

新网站上线后迟迟不好收录,如何处理

新网站上线后迟迟不好收录,如何处理

  新网站上线后,百度会对网站进行考核,然后才会收录网站。一般情况下首页的话一个月之内就可以收录了,像文章、栏目页这些两至三个月收录也是正常的,如果你的网站几个月,那么就要想办法解决了,下面分享一些实战经验,大家参考下。  网站上线后,还不收录需要排查以下几个方面:  1、robots.txt文件是...

百度凤巢系统对搜索优化的影响

百度凤巢系统对搜索优化的影响

首先是百度将原有的“竞价排名”和“自然排名”一起显示的方式全部修改成和现在Google相同的呈现方式(虽然赞助商链接不是那么明显,广告的底色也打得很浅。)。原来页面内最多显示10条竞价广告,在凤巢系统上线后,将改为最多显示3条竞价广告,同时搜索结果底部也将显示一条竞价广告。总的来说影响最大的要所百度...

SEO搜索引擎排名优化方案

SEO搜索引擎排名优化方案

做个人博客大多数是有情怀缘故,该博客是第三版 是PHP语言捣扯的-情怀不能当饭吃,做着做着感觉自己看那没意思了,我要让更多人能看到我的分享。于是就搞SEO优化到不可收拾的地步—-入了这个行业。 回老家工作那两年一直在兼顾着做网站推广优化,也帮忙给朋友的公司做全网营销计划方案。今天选分享一下...

防止网站被挂黑链的方法

防止网站被挂黑链的方法

  大家在做优化的时候,应该有不少人都遇到过被挂黑链的现象,想来也是十分的令人烦扰,应该没有人希望会遇到此类情景吧。那么,有没有什么方法可以帮助我们防止网站被挂黑链呢?seo优化带大家前去看看有哪些检查方法可以帮助我们进行防止此类现象的出现。  网站被挂黑链,通常就是黑客利用网站程序或者是语言脚本解...

来自google关键词SEO排名第一的教学

来自google关键词SEO排名第一的教学

最近在研究谷歌SEO的方法(谷歌优化内容或教程会在以后慢慢写),查询到了不少有用的内容,在一次搜索seo这个关键词时,发现和百度搜索大相径庭,国内的网站点进去内容非常多,基本围绕seo这个词写了非常多的文章,不管是原创还是转载基本都是在堆积内容,而google搜索排名前几...