当前位置:首页 > SEO培训 > 正文内容

搜索引擎爬虫对网页的三种更新策略

admin4年前 (2022-07-29)SEO培训553

  很长一段时间以来,成都SEO一直围绕着爬虫抓取来讲述相关的信息,今天成都SEO将与大家分享搜索引擎抓取更新的三种策略。

  搜索引擎爬虫的更新主要应用于快照等更新,以及搜索引擎对搜索页面的爬网行为。至于为什么要重新爬网,基本上是因为互联网上有数以万亿计的页面。许多页面在不断变化。这个不断变化的前置因素导致爬网程序不断更新自己的数据,因此它必须重新爬网已爬网的网页。那么搜索引擎爬虫的三大更新策略是什么?

  搜索引擎爬虫历史更新策略

  所谓的历史更新策略是为已被爬网的网页设置重新爬网的时间限制。例如,爬虫对我的SEO博客主页进行爬网,搜索引擎通过爬网获得我的博客主页。爬虫的爬行策略被调整为每3天访问一次我的博客主页。

  这种更新爬行策略告诉我们,网页中的频繁更改将导致蜘蛛频繁爬行。如果你的页面都是静态的。这意味着,如果不重新生成相应的页,则不会对其进行更改。相对而言,你不太擅长这种策略逻辑。因此,URL被设置为伪静态。在网站开放速度可控的前提下,将网页本身设置为动态页面是一个不错的选择。

  搜索引擎爬虫的用户体验更新策略

  所谓用户体验网页更新策略,是指搜索引擎认为网页参与具有一定的搜索量词排名,前三页是用户经常访问的网页。然后我们应该优先对这些页面的更新进行爬网。

  对于3页之后的用户,访问的人很少,以后更新也不错。因此,采用了一种web爬行更新策略。

  这个策略让我们知道,一些核心关键字排名较高的网页更经常被爬虫程序爬网。那么一个值得思考的问题是,网站也会有一些细节页面、聚合页面,甚至文章页面参与错别字的排名。这是否意味着这次的页面爬网量不错?针对这个问题,成都SEO此前通过对访问日志的分析,确定了这个答案。在80%的案例中,确实如此。但是,这些页面的频率远低于主页、频道页面和其他更靠近主页且路径更短的页面。

  但是,我们仍然可以优化详细信息页/文章页,以便在此类页上显示最新内容,并增加爬网程序条目以包含最新内容。

  搜索引擎爬虫抓取网页的抽样聚类策略

  说到这个策略,我们首先从字面上看“抽样,聚类”。抽样是指从网站上抽取一些样本进行观察,聚类就是根据这些样本的观察结果得出一定的结论后应用这种类型。

  我们的网站由不同的类型组成,如列表页面、产品详细信息页面、文章页面、频道页面、聚合页面等。这些都是不同的类型。搜索引擎从中间选取一些样本,观察并获得更新周期,应用于整个类型的方法是抽样聚类的web爬行更新策略。

  我们举个例子。搜索引擎通过从列表页中取样来查找A列表页。通过分析和观察,发现A列表页面可以每2天进行一次爬网。然后有与A列表页类型相同的B、C和D列表页,因为它们具有相同的模板、导航,并且第一页上的模块也指这四个列表页。然后它们是相同类型的,所以B、C、D列表页与A列表页相同,并且它们在2天内被获取。

  好吧,今天的分享就在这里,希望能帮助你,如果有任何问题,请留言给我。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=3870

分享给朋友:

“搜索引擎爬虫对网页的三种更新策略” 的相关文章

怎么学习SEO?SEO速成五大学习心得!

怎么学习SEO?SEO速成五大学习心得!

很多新站长们刚加入互联网这个大环境,都想通过搜索引擎这个免费的流量的通道获取大量的流量,但并不是每个人都知道掌握SEO优化的细节,所以导致大家在获取这个流量 的时候有时付出了大量的时间和精力,有时甚至精力时间花费了却流量也没有来,在这过程中很多站长都会放弃,其它SEO是一门技术,里面包含的...

我从0学习SEO做出权重6网站赚到100万的经历

我从0学习SEO做出权重6网站赚到100万的经历

今天这篇文章记录下我从做seo到采集站seo赚钱的过程。当你在互联网上开始创业赚钱做项目的时候,学了各种大招结果发现没有用户,大招全是废招。当年我也是这么开始的,帮别人推广,没有用户赚不钱,去做淘宝客没有流量也赚不到钱。后来帮我老师推课程,第一次应该是赚了200多。然后我就总结不管网络上做什么推广引...

seo外链论坛发布用有吗?SEO外链论坛发布工具

seo外链论坛发布用有吗?SEO外链论坛发布工具

原标题:seo外链论坛发布用有吗?seo外链论坛,什么是SEO外链论坛?怎么批量发布SEO外链到论坛。今天给大家分享一款免费批量发布到论坛的SEO外链论坛工具。只需要导入链接,便可自动发布详细参考图片。随着网络优化技术的普遍,越来越多的人开始尝试着停止搜索引擎的优化学习。那么今天我们就来总结一下,s...

为什么大站采集内容比原创的排名好

为什么大站采集内容比原创的排名好

问题:一些大网站总是采集我的内容 为什么他们的排名比我的好?百度站长平台权威解答在知名网站上阅读你的内容,往往会获得很多额外的好处,例如更少的广告,更快的加载速度,更多的用户互动,更多的相关内容,更清晰的排版。因此在建设内容时,不仅仅光考虑内容本身,还需要兼顾用户的浏览体验。解释虽然百度方面提到了用...

有必要参加SEO培训吗?自学可以吗?

有必要参加SEO培训吗?自学可以吗?

SEO人员在职场上总会碰上一些难解的问题,很多人也不懂得自己学习SEO该往哪些方向发展。每个SEO人员都希望能够通过SEO这个技术让自己的收入越来越高,人生道路能越走越宽,那么到底应该怎样做,其中又有哪些需要注意的,本篇将用一问一答的形式,讲解一些SEO人在职场常见的问题。1、做SEO一定要有利他之...

SEO的优点和缺点

SEO的优点和缺点

SEO结合了付费推广和软文的优点,并且避开了两者的缺点。SEO的流量是从各平台的搜索引擎来的,是用户主动搜索的,所以流量十分精准。而SEO又不像PPC付费推广那样让人看出来是赤裸裸的广告。SEO的优点:1、成本低廉,现在付费推广广告费用是很高昂的,付费广告长期投放的话,一些中小企业很难承受的,相比之...