3种网站被镜像、采集的最佳解决方法
今天上网发现搜索引擎中出现了一个和自己网站一模一样的网站,自己发了一篇文章,他就能自动跟进采集,并且文章排名比自己的还高,排在我网站的前面,FUCK啊,这是网站被恶意镜像了。
什么是网站镜像?
网站镜像,就是通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为,这也是为什么有的网站注明禁止未授权不得做网站镜像的原因了,两个网站的内容完全一样,相似度过高必然会导致自己的网站受到影响。
网站镜像就是网站的复制版本。
如果是别人把自己的站原样做一份放在网上,网站的主人肯定是不能容忍的,可以用搜索引擎找到这样的站, 现在这样搞的人已经比较少了,以前我们经常会发现有人这样照抄别人的网站。所以,那时候很多网站都加了一句严禁建立镜像。
网站被镜像的3种解决方法
方法1:找到镜像网站的主机Ip,通过禁止Ip来解决
具体方法,大家百度解决,不多说。注意ping 域名的话不一定是真实IP,现在很多网站都隐藏真实IP了。
找到镜像网站的IP后,就可以禁止IP来阻止镜像网站复制你的站点了。这招对采集站也有效哦!
在网站主机提供商的网站后台控制面板里有设置IP访问黑名单,如果没有请联系服务器提供商。
如果你是wordpress站点,也可在.htaccess文件里添加如下代码:
#添加IP黑名单
Order Deny,Allow
Deny from 162.158.72.179
这个时候你再刷新一下镜像站点,是不是已经403报错了呢?
此方法的缺点就是如果镜像网站更换了ip,那我们的屏蔽就失败了
方法2:在中加入JS来防护
<script type=”text/javascript”>
if (document.location.host != www.laosuseo.com) {
location.href = location.href.replace(document.location.host,’www.laosuseo.com’);
}
</script>
或加上以下的JS代码
<script type=”text/javascript”>
rthost = window.location.host;
if (rthost != “www.laosuseo.com”) {
top.location.href = “http://www.laosuseo.com”;
}
</script>
将上面代码中的www.******.com改为你网站的首页主地址,如果上面填写的不是网站的主地址 www.******.com,而是 mobile***.com的话,就会导致网站一直刷新!
注:经过本站测试,如果镜像站屏蔽了JS,则该方法失效。所以,最好把方法2和方法3结合使用!
方法3:Js被屏蔽后防止镜像的方法
将以下代码加到网站的header.php中
<div style=”display:none;”>
<script>proxy2025 = false;</script>
<img src=”” onerror=’setTimeout(function(){if(typeof(proxy2025)==”undefined”){window.location.host=”www.laosuseo.com”;}},3000);’>
</div>
<script>proxy2025 = false;</script>
img的onerror设置超时时间3000毫秒,将运行函数部分,检测是否还存在proxy2025字符,如果没有找到就会将主机的URL改为www.laosuseo.com;
经过测试,此代码在Chrome、IE11和360极速浏览器上均有效,会跳转到源站的原文章页!在Firefox上则无效果,镜像的文章页并不会跳转到原站…… 将代码中img标签的src引用地址改为空格或无效的图片地址后,在Firefox上也起作用了!
WordPress适用版
将下面的代码贴到 functions.php 中的最后一个 ?>之前即可:
另为保护JS安全,使用JS方法禁止网站被镜像的站长,在编写好JS代码后,最好使用站长网的JS代码混淆工具后,再放到网站上。