当前位置:首页 > SEO知识 > 正文内容

如何解决搜索引擎爬虫重复抓取问题

admin2年前 (2023-03-09)SEO知识270

针对每一位SEO从业者而言,爬虫每天来我们的网站进行网页的抓取,是十分宝贵的资源。

但在这中间由于爬虫无序的抓取,势必会浪费一些爬虫的抓取资源。

这中间我们就需要解决搜索引擎爬虫对我们的网页重复抓取的问题,下面赵彦刚与你一起来聊一下如何解决这个问题。

在聊这个问题之前,我们需要理解一个概念。首先爬虫本身是无序的抓取,他不知道先抓什么再抓什么,只知道看到了什么,且计算后认为有价值就进行抓取。

而对于我们而言,抓取的整个过程中,我们最要解决是如下几类:

●新产生的页面,没有被抓取过的

●产生了一段时间,迟迟不被抓取的

●产生了一段时间,却一直没收录的

●产生很久的页面,但最近更新了

●包含内容更多的聚合页面,如首页、列表页

如上几类,按照顺序我们定义哪一类最需要被爬虫抓取。

针对大型网站,搜索引擎爬虫抓取资源过剩,而针对小网站,抓取资源稀缺。所以在这里我们强调一下,我们不是要解决搜索引起爬虫重复抓取的问题,而是要解决搜索引擎爬虫最快的抓取我们希望抓取的页面。要把这个思路纠正!

下面,我们聊一下怎么让搜索引擎爬虫最快的抓取我们希望被抓取的页面。

爬虫是抓取到一个网页,从这个网页在找到更多的链接,周而复始的过程,那么这个时候我们就要知道要想被爬虫更大概率抓取,就要给更多的链接,让搜索引擎爬虫发现我们希望被抓取的网页。这里我拿上述的第一种情况举例说明一下:

新产生的页面,没有被抓取过的

这类一般都会是文章页,针对于这类我们的网站每天都会大量产生,所以我们就要在更多的网页给予这部分链接。例如首页、频道页、栏目/列表页、专题聚合页、甚至文章页本身,都需要具备一个最新文章板块,以此等待爬虫抓取到我们的任何网页时,都能发现最新的文章。

同时,试想一下,这么多页面都有新文章的链接,连接传递权重,那这新文章,既被抓取了,权重也不低。被收录的速度会明显提升。

那针对那些长时间不收录的,也可以考虑是不是权重太低了,我多给一些内链支持,传递一些权重。应该会有收录的可能。当然也有可能不收录,那你就要靠内容本身的质量了。之前有一篇文章是专门说内容质量的也欢迎大家阅读:什么内容容易被百度判断为优质内容?。

所以,我们为了解决搜索引擎爬虫重复抓取问题不是我们最终要解决的。因为本质上搜索引擎爬虫是无序的,我们只能通过针对网站的架构、推荐算法、运营策略等进行干预。使爬虫给予我们更理想的抓取效果。如果你不会根据爬虫的自身抓取效果进行优化网站,也可以联系我。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://www.laosuseo.com/?id=21006

分享给朋友:

“如何解决搜索引擎爬虫重复抓取问题” 的相关文章

SEO优化推广需要投入多少?

SEO优化推广需要投入多少?

1.实际上,在SEO优化方面,没有关于网站优化的价格。因为价格和很多因素有关。由于行业和企业具有不同的优化因子,无法准确地确定价格。2.如果您希望了解关键词优化的价格,您还可以从网站获得搜索结果。分析网站,可以了解到关键词优化的难度。若关键词占主导地位,就能很难理解关键词优化,所需要的优化价格将非常...

自学SEO技术,怎样学才学的好「新手必看」

自学SEO技术,怎样学才学的好「新手必看」

​不管学习什么技术,也不管是参加培训还是自学,都还要看自己的自律性,乐建所认识的一些人中,有自学也有参加培训的,但是都没有学成,就是因为缺乏学习的自律性,很多人一直追求快速简单学习的教程,企图想通过又快又简又免费的途径提升自身价值,相信现实会给你一个狠狠的耳光的,那么作为SEO新人,如何正确的学好S...

SEO和SEM的区别是什么?

SEO和SEM的区别是什么?

这是第39篇原创文章,主要分享一下SEO和SEM的区别具体有哪些,希望对大家有一点点帮助。关于SEO和SEM的区别我们可以从以下6个方面进行对比和区分,即定义、效果、价格、难度、展现、转化。第一点、在定义方面的区别(或者说范围)1、SEO指的是搜索引擎优化,更倾向于技术方面;2、SEM指的是搜索引擎...

SEO学习的最好方式:搜索引擎

SEO学习的最好方式:搜索引擎

学习SEO的最佳方式是每天使用搜索引擎。大多数人已经每天使用搜索引擎来查找商品、服务和信息。您需要做的就是扩展您当前的SEO 使用以涵盖与您的网站相关的搜索。刚开始搜索,开始在网络上搜索您认为应该为您的网站生成结果的关键字查询。通过这种方式,您可以按照自己的节奏学习SEO,并密切关注您的竞争对手。理...

新手如何自学谷歌SEO

新手如何自学谷歌SEO

题主问题描述:目前主要是做shopify站内运营,但平时比较少接触到SEO,所以想自学,看平时能不能用得上。解答:首先抛结论,题主目前主要在做Shopify,那领域应该就是外贸或者相关了,谷歌seo对外贸和一些出海的业务肯定是有价值的,自然也用得上。况且多掌握一个技能也不是坏事。如何自学谷歌seo这...

SEO如何入门?SEO是什么?SEO网站推广怎么做?

SEO如何入门?SEO是什么?SEO网站推广怎么做?

从网站推广到APP推广,再到微信推广运营,网站运营。事情涉猎的多了,觉得好多是相通的,比如网站的SEO,APP的ASO。今天我们来梳理下SEO那些事儿。什么是seo?SEO由英文Search Engine Optimization缩写而来, 中文意译为搜索引擎优化。它是指从自然搜索结果获得网站流量的...