网站被镜像的问题处理方法
在常见负面SEO帖子里见到,我这个小博客有几十个域名镜像我。有读者提问,怎么知道自己被镜像了,网站被镜像又改怎么处理。今天我们来聊一下。
一、什么是恶意镜像网站?
镜像网站指的是和你的网站基本一样、并且实时同步的其它网站。就像照镜子一样,所以名为镜像。
有的镜像网站是没有恶意的,很可能是你自己设置的,为了方便用户能从多个域名访问网站,被封了一个,还有其它的域名。比如****的草榴社区,好像就有很多镜像可以访问。有的镜像,也就是这里讨论的镜像,是不怀好意的,通常是别人设置的,要么为了负面SEO你的网站,要么为了利用你的内容获得排名,然后把用户转向到敏感、非法内容网站上去。
网上有的文章把采集和镜像混在一起。虽然表现形式差不多,但严格来说,采集和镜像实现方法、表现形式是有区别的。
采集的网站一般是提前抓取别人网站的内容,放入自己数据库,再用程序调用到页面上。被采集网站有新内容时,采集网站并不能实时同步更新,要再采集之后才能出现。一旦被采集,内容已经在对方数据库里了,从技术上是无法阻止采集网站显示这些内容的。这篇帖子说的不是这种。
镜像网站并不事先抓取内容,而是有人访问网站时,实时从被镜像的网站调取内容,做些处理(替换URL、文字,加文字、加JS等),然后实时显示。被镜像的网站有任何更新,镜像网站是实时同步的。
网上有卖用于镜像网站的小偷程序的。小偷程序通常也可以用来做采集。为了不给他们做宣传,就不提名字了。从他们的官网摘取几条程序功能,有助于理解后面的内容:
1)、全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片
2)、内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
3)、伪原创,近义词替换有利于seo
4)、增加URL路由,实现全站URL变换,个性化本站URL地址
5)、超级模板增加移动模板、自定义栏目功能
6)、增加自动获取301、302重定向的采集,解决跳WWW,跳https采集
7)、代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施
二、网站被恶意镜像带来的危害
从SEO角度看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本一样,搜索引擎有可能认为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。
对有一定历史、权重的网站,镜像网站取代原版网站的可能性微乎其微。但从心情角度考虑,被别人镜像,内容被别人偷走,即使没有其它明显后果,也还是挺烦人的一件事。另一个烦人的事是,镜像网站一般来说并不是要和你提供同样的产品或服务,而是把用户转到赌博、色情等服务上去。有的是通过JS把赌博、色情内容显示给用户,有的直接把用户转向到另外的网站上去。
1)、网站流量明显减少,关键词排名逐渐降低;
2)、当网站被镜像后,不及时处理,时间一长很容易被降权,如果再想恢复就要花更多的时间与精力;
三、怎样发现自己网站是被镜像了
有时候注意到被镜像了是因为自己网站排名下降,怀疑有人负面SEO。有时候是搜索品牌名称,看到镜像网站。已经知道自己被镜像了好办,直接看下面怎么处理部分。
很多站长则完全不知道自己网站是否被镜像了。有几个我常用的检查方法。
1)、是百度统计后台:
受访域名部分列出了使用相同百度统计代码的域名。其中出现快照、百度/谷歌翻译等是正常的,但出现一些奇奇怪怪的域名就要查看一下了。
2)、是搜索网站的特征句子。最容易想到的是网站品牌名称、首页标题等,确实可以发现一些镜像网站。但有时品牌名绝大多数是会被替换的。
四、网站被镜像了怎么办?网站被恶意镜像该怎么处理?
首先,一些在网上提到的解决办法其实并没有什么用。
比如有的说页面上的链接用****地址有帮助,其实小偷程序都会自动替换网址,用相对地址还是****地址没什么差别。
还有的说页面上加上网站链接、网站名称、版权声明之类的,搜索引擎会识别哪个是正版。但镜像小偷程序连链接带文字都可以全部自动替换,这么做并没有用。
发现镜像网站后的处理原则就是让镜像网站不能在镜像域名上显示你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,所以可以考虑几个方法:
1)、比如用JS检测一下正在被打开的页面是不是在自己的域名上,是的话正常显示,不是的话(域名是镜像网站时)强迫转向到自己域名:
if (window.location.hostname !== ‘bj.youhuabaidu.com’){
window.top.location.href = ‘http://bj.youhuabaidu.com/’;
}
(声明:我对程序不熟,代码只是简单举例,具体怎么写,请问你的程序员。)
不过这种方法只对用户有效,搜索引擎不执行JS,还是会抓取到镜像内容。也可以用PHP写脚本判断和转向。
有时候由于种种原因,程序不起作用。
2)、另一个直接的方法是屏蔽镜像网站来访问的IP地址。先查一下镜像网站服务器IP。把对方主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的服务器。要发现必须屏蔽的IP,需要查看网站原始日志。我的一个小窍门是,访问镜像网站上一个很少人会访问的页面,比如翻页第70页,然后马上查看日志,这个页面被访问的IP就是应该屏蔽的IP:
屏蔽了这个IP,再访问镜像网站就变成403错误了:
不知道页脚的友情链接是镜像网站自己加的?还是卖程序的人强制加的?
镜像网站经常是会伪造或实时轮换IP地址的,如果屏蔽一个IP网站还能访问,就再访问翻页69页、68页等等,找到更多IP。屏蔽也可以屏蔽IP段。我的经验是,通常镜像网站不会使用超过10个IP地址。
当然也可以写个简单的脚本放自己网站上,比如bj.youhuabaidu.com/mirror.php:
echo $_SERVER[‘REMOTE_ADDR’];
?>
脚本****功能就是显示访问的IP,然后自己访问一下小偷镜像网站的脚本网址,页面上就直接显示镜像网站访问你服务器时的IP了。如果镜像网站替换了URL,这个方法就不好用了。无论怎样,日志中是一定有的。
3)、通过域名、title即轻松判断为镜像的恶劣站群,如果依然在各关键词下获得排名,可以通过站长平台进行反馈:https://ziyuan.baidu.com/feedback/
4)、无法持续区分真假的站点,需要保护自我权益的站点可以向百度投诉:https://www.baidu.com/duty/right.html 提供各种资质证明,会有百度法务部的员工审核处理。在这里提醒各位站长,请尽可能提供最全最有说服力资质证明,包括且不限于网站备案证明、品牌营业证明等,以帮助工作人员持续判断。
5)、如果站长发现镜像站点同时做恶劣赌博、色情内容,站长可以投诉(http://jubao.baidu.com/jubao/),百度公司相关员工会进行处理。
总结:处理网站被镜像的方法基本就是这些,如果被镜像的网站站已经死链或者在相关关键词下没有排名,那证明镜像站点已被反作弊策略识别并处理,被镜像的站长也就不用担心了。
SEO就是搜索引擎优化:让你的网站在搜索引擎(比如百度、谷歌)的排名更靠前,当用户通过关键词搜索时更容易搜到你的网站,从而实现企业品牌曝光、主动获客和营销推广的目标。为什么要做SEO?
提高网站访问量:SEO能让你的网站在搜索引擎结果中更靠前,吸引更多客户点击。
降低市场营销成本:相比于付费广告,SEO是一种更经济有效的营销方式。
提升品牌知名度:网站排名靠前,可以让更多用户看到你的品牌名称和信息,增强品牌影响力。
SEO优化有哪些优势?
成本低廉:主要成本是优化师的工资。
效果稳定:一旦网站排名上升,效果稳定持久,可持续获得展现机会。
不受地域限制:SEO的效果可以覆盖全球,不受时间和空间的限制。
什么样的公司更适合做SEO优化呢?大多数行业都可以从SEO中受益。特别是那些希望用户主动访问我们的网站、降低营销成本、提升品牌知名度的企业。通过SEO来优化自己的网站,可吸引更多潜在客户。
SEO是一种工人的有效的网络营销手段,可以帮助企业提升关键词排名,吸引更多用户,实现商业目标。SEO是一个长期且专业的技术,企业在进行SEO时,必须耐心优化,因为SEO涉及到的不止是网站结构、内容质量、用户体验、外部链接这几个方面;还有算法的更替、蜘蛛的引导、快照的更新、参与排序的权重等。
SEO策略
搜到你
让用户搜到你的网站是做SEO优化的目标,拥有精湛的SEO技术、丰富的经验技巧以及对SEO规则的深刻把握才有机会获得更云无限!
了解你
确保网站内容清晰、准确、易于理解,使用户能够轻松找到所需信息.使用简洁明了的标题和描述,帮助用户快速了解你的产品服务!
信任你
将企业的核心价值、差异化卖点、吸引眼球的宣传语等品牌词尽可能多的占位搜索前几页,增强用户印象,优化用户体验让访客信任你!
选择你
优化落地页引导用户咨询或预约留言,引用大型案例或权威报道彰显品牌实力,关注用户需求和反馈,不断优化产品服务让用户选择你!
关键词研究
品牌关键词
提升品牌知名度、塑造品牌形象,吸引对品牌感兴趣的用户,同时帮助监测品牌在搜索引擎中的表现。
核心关键词
是网站内容的主要焦点,能吸引大量目标受众,提高网站在相关搜索中的排名。搜索量大,竞争较激烈。
长尾关键词
更能够更精确地定位目标受众,提高转化率,竞争相对较小更容易获得排名,更符合用户的具体搜索意图。
区域关键词
针对特定地区进行优化,帮助本地企业吸引当地用户,提高本地市场的曝光度。适用于有地域性需求的企业。
竞品关键词
与竞争对手品牌或产品相关的词,通过分析这些关键词,可以了解竞争对手的优势和劣势。
产品关键词
直接针对产品进行优化,与具体产品或服务直接相关,如产品名称、型号、功能等描述性词汇。
搜索下拉词
反映用户的搜索习惯和需求,是搜索引擎根据用户输入自动推荐的词汇,与用户搜索意图高度相关。
相关搜索词
提供与主题相关的其他搜索词汇,帮助用户发现更多相关内容,同时扩展网站的优化范围。
站内SEO
TDK优化
力争一次性完成网站页面标题、描述、关键词的的合理部署
链接优化
包含LOGO链接、导航链接、文章链接及外部链接等SEO优化设置
HTML优化
HTML代码、标签等优化:H,alt,strong,title,span,title等标签
内容优化
固定内容与关键词SEO匹配、动态内容提升蜘蛛抓取率增强快照评级
站外SEO
1)降低文章内容在搜索结果的重合度。尤其是文章标题、段落主题、内容摘要等;
2)标题包含关键词(可包含部分或完整匹配)字数控制在24字内;
3)提炼的文章概要(100字内)必须与关键词有相关性才有意义;
4)新文章不要增加锚文本超链接,等文章快照有排名后再扩充锚文本链接;
5)文章内容与标题关键词相呼应,建立关联,也可根据关键词扩充有关的内容;
6)文章中的图片最好增加alt属性,图片不要失真和变形,宽度大于500px更优机会抢占搜索快照缩略图;
7)文章排版合理、段落分明、段落主题用H标签加强,段落内容用span或p标签区分;
8)发布文章后先引导收录。如提交搜索引擎登录、合理使用有排名快照的内部链接;
9)如果文章7天还没有收录,就要提升文章内容质量再发布;