当前位置:首页 > SEO培训 > 正文内容

搜索引擎爬虫对网页的三种更新策略

admin3年前 (2022-07-29)SEO培训444

  很长一段时间以来,成都SEO一直围绕着爬虫抓取来讲述相关的信息,今天成都SEO将与大家分享搜索引擎抓取更新的三种策略。

  搜索引擎爬虫的更新主要应用于快照等更新,以及搜索引擎对搜索页面的爬网行为。至于为什么要重新爬网,基本上是因为互联网上有数以万亿计的页面。许多页面在不断变化。这个不断变化的前置因素导致爬网程序不断更新自己的数据,因此它必须重新爬网已爬网的网页。那么搜索引擎爬虫的三大更新策略是什么?

  搜索引擎爬虫历史更新策略

  所谓的历史更新策略是为已被爬网的网页设置重新爬网的时间限制。例如,爬虫对我的SEO博客主页进行爬网,搜索引擎通过爬网获得我的博客主页。爬虫的爬行策略被调整为每3天访问一次我的博客主页。

  这种更新爬行策略告诉我们,网页中的频繁更改将导致蜘蛛频繁爬行。如果你的页面都是静态的。这意味着,如果不重新生成相应的页,则不会对其进行更改。相对而言,你不太擅长这种策略逻辑。因此,URL被设置为伪静态。在网站开放速度可控的前提下,将网页本身设置为动态页面是一个不错的选择。

  搜索引擎爬虫的用户体验更新策略

  所谓用户体验网页更新策略,是指搜索引擎认为网页参与具有一定的搜索量词排名,前三页是用户经常访问的网页。然后我们应该优先对这些页面的更新进行爬网。

  对于3页之后的用户,访问的人很少,以后更新也不错。因此,采用了一种web爬行更新策略。

  这个策略让我们知道,一些核心关键字排名较高的网页更经常被爬虫程序爬网。那么一个值得思考的问题是,网站也会有一些细节页面、聚合页面,甚至文章页面参与错别字的排名。这是否意味着这次的页面爬网量不错?针对这个问题,成都SEO此前通过对访问日志的分析,确定了这个答案。在80%的案例中,确实如此。但是,这些页面的频率远低于主页、频道页面和其他更靠近主页且路径更短的页面。

  但是,我们仍然可以优化详细信息页/文章页,以便在此类页上显示最新内容,并增加爬网程序条目以包含最新内容。

  搜索引擎爬虫抓取网页的抽样聚类策略

  说到这个策略,我们首先从字面上看“抽样,聚类”。抽样是指从网站上抽取一些样本进行观察,聚类就是根据这些样本的观察结果得出一定的结论后应用这种类型。

  我们的网站由不同的类型组成,如列表页面、产品详细信息页面、文章页面、频道页面、聚合页面等。这些都是不同的类型。搜索引擎从中间选取一些样本,观察并获得更新周期,应用于整个类型的方法是抽样聚类的web爬行更新策略。

  我们举个例子。搜索引擎通过从列表页中取样来查找A列表页。通过分析和观察,发现A列表页面可以每2天进行一次爬网。然后有与A列表页类型相同的B、C和D列表页,因为它们具有相同的模板、导航,并且第一页上的模块也指这四个列表页。然后它们是相同类型的,所以B、C、D列表页与A列表页相同,并且它们在2天内被获取。

  好吧,今天的分享就在这里,希望能帮助你,如果有任何问题,请留言给我。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=3870

分享给朋友:

“搜索引擎爬虫对网页的三种更新策略” 的相关文章

最牛SEO:五万以上SEO月薪工作职责

最牛SEO:五万以上SEO月薪工作职责

  1、负责网络安全品牌的网络推广的工作,制订网络推广策略、计划与预算;  2、负责公司网站的SEO;  3、负责搜索引擎竞价排名、社区等多种推广;  4、负责与广告联盟建立最优合作关系;  5、负责论坛,社区推广;  6、负责BLOG营销策略的制订与实施;  7、负责网上商店推广策略的制订与实施;...

对新人来说想学SEO但不知道从何做起怎么办?

对新人来说想学SEO但不知道从何做起怎么办?

SEO其实没有想象中那么难下手,现在互联网资源这么丰富,所以我们可以从网上找到一些SEO的基础教程认真的看完,不管怎么样,先要有一定的理论基础。不需要先掌握多么高深的SEO知识,主要先摸着门道就行。大概的了解了SEO之后,我们需要结合具体的实际操作来学习真正的SEO优化技术。所以我建议大家可以像我一...

SEO主要是做什么的?零基础能学习吗?

SEO主要是做什么的?零基础能学习吗?

点头像关注我哦,分享seo行业成长故事~ 这个话题可以拆分成两个部分: 1、seo是做什么的? 2、零基础能不能学seo(以及怎么学、要注意什么)? 那就分开回答,更清晰一点。seo 一、seo是做什么的? 先说第一个,seo是做...

搜索引擎原理及对内容的处理

搜索引擎原理及对内容的处理

搜索引擎捕获内容将包含在数据库中,当用户搜索搜索引擎将包含内容呈现给用户时,为了快速向用户呈现内容,搜索引擎需要处理捕获的内容,只留下关键信息,以便在用户启动搜索时快速呈现所需的内容。搜索引擎主要有四个步骤来处理蜘蛛抓取的页面。第一:判断页面的页面类型判断页面是正常的普通页面还是普通页面PDF等待特...

SEO优化培训课程和自学,对于新手来说哪个更好?

SEO优化培训课程和自学,对于新手来说哪个更好?

新进入SEO行业的朋友,经常会出现学习SEO从哪入手的问题,到底是自学还是参加seo优化培训课程这个问题,其实,这和个人的学习能力、对SEO的理解能力不同而不同,但我们建议大家都要按一定的步骤来学习SEO,可以进步的更快。那么,seo优化培训课程和自学对于新手来说哪个更好?1.SEO书籍书籍一直都是...

seo关键词优化推广方式有哪些?

seo关键词优化推广方式有哪些?

关键词seo优化一直是企业网站中一个非常重要的内容,今天就给大家列举一下seo关键字优化推广的方法:首先,对关键字进行分析,并选择目标关键词,长尾词。关键词出现较多的是一些主要产品的名字或者叫法不同的产品,如果把一些关键词作为企业网站的目标关键词来实施,那是绝对不行的,很费时费力,所以一定要做好企业...