文章要点:
- 搜索引擎的反作弊策略
- google匿名爬虫
- 作弊的取舍
先讲一个作弊方法。以下的一个作弊方法,至今还能行得通的。
代码如下:
<TABLE>
<TR>
<TD HEIGHT=”1000″ BGCOLOR=”#000000″ BACKGROUND=”White.jpg”> <FONT COLOR=”#FFFFFF”>隐藏文字 隐藏文字</FONT> </TD>
</TR>
</TABLE>
这段代码,搜索引擎看到的是一个黑色背景下有一些白色的文字,这是不算作弊 的。但是用户看到的就是一片白色,不会看到里面的文字。原因就是用一张白色 的图片作为了背景。在以 table 布局的网页里,如果同时定义了一个 table 的背 景颜色和背景图片,它是优先显示图片颜色的。这样,用户看到的是一片白色背 景下的白色文字,当然就看不到这些文字了。这种作弊方法利用了一点:就是搜 索引擎至今不能识别一张图片的颜色。
当然搜索引擎还有很多其他弱点。迈克·摩尔曾经说过:确实有办法愚弄搜索引 擎,但是只有少数人能真正办到。其实他就是其中的一个,因为他自己做了 20
年的搜索引擎技术研究,在搜索引擎领域有很多专利,能从头到尾建立一个搜索 引擎。 但是他那样的专家,是不会用一些作弊的方法来做 SEO 的,原因就是这样做太蠢 了。
这要从搜索引擎反作弊策略说起。一个搜索引擎成功的反作弊策略一定是这样 的:
1,允许算法被探测出来,而且即使算法被公布,搜索结果的公正性都不会受太 大影响。要这么做的原因就是不希望和作弊的人陷入到一种猫捉老鼠的死循环当 中。如果老是以堵漏洞的做法来修正算法,那永远都没有尽头。出于这样的考虑, 搜索引擎会把那些无法被作弊的的因素在排序算法里放到比较重要的程度。
2,尽可能用一切技术手段自动检测,当技术手段不能解决问题,就用人工来解 决。然后把人工发现的问题又反馈给自动检测机制,使自动检测越来越完善。
现在的 google 基本上就是这样来做的。在现有的排序规则中,那些无法作弊的 和能精确反应内容的因素,都是很重要的排序因素。
当然 Google 也不排斥频繁的调整算法,这也有出于给用户一个好的搜索体验 考虑的。
至于技术检测和人工审查,google 也一直在做。
google 很早就有匿名蜘蛛来检测一个网站是不是在作弊的。如果去分析网站的 服务器 LOG 日志,就会发现它们。
你会发现,有的爬虫,通过 IP 查询是来自 google,但是它没有自己的声明 (user-agent),这就是 google 的匿名爬虫。它会判断你有没有对 google 爬虫 特别对待,做一些隐藏页面,还会解析 Javascript 文件和 CSS 文件等等。有人 用 CCS 文件来隐藏内容,这种事情现在是不用去做的,google 都能查出来。
Google也有人工审核机制,从webmaster tool 里提交的问题,都是有人工跟进 审核的。以下就是号称google内部流传出来审核规则,可以点此下载。
既然 google 反作弊那么优秀,那文章一开始提到的那个作弊方法怎么解决呢?
那个方法 google 确实检测不出来,但是用这个方法的人,到后还是会被 google 发现作弊。
google 的反作弊是“善意原则”优先,是假设你这个网站是没有作弊的,但是 用其他所有作弊的特征来检查。 用了我提到的这个方法,在用颜色隐藏内容这 一块是没事了,但是会在堆砌关键词,反向链接,以及其他很多方面路出马脚来。 google 就是相信,一个在页面上隐藏内容的人,也一定会去做垃圾链接群发等
等其他作弊的事情。就像现实生活中一个吸毒的人,当然也是爱打架的,或者爱 偷东西的,总有一件事情让你进局子里。
而你假设其他什么都不做,就是用那个方法隐藏一点内容,其实你也不能得到什 么。因为你仅仅是隐藏内容的话也不会有排名的。
google 就是这样捍卫了自己排名的公正性。
对这些了解得越多,就越发现作弊实在是费力不讨好了。(作弊源于不了解,通 过正常途径提升 SEO 流量的方法有的是,为什么放弃那么多好的方法而选择差的 方法呢?在现在的 SEO 界,你会发现一个现象,越是 SEO 刚入门的人越喜欢搞一 些作弊的事情,而 SEO 从业越久的人,就越不会参与这些。)
想做一个优秀 SEOer 的人,对所有这些因素都要有一定程度的了解的。这样做即 可以避开无意中犯下的错,又可以避免不必要的恐慌。
比如沙盒效应,很多人总觉得很神秘,其实从搜索引擎的角度出发没什么好神秘 的。你要是站在搜索引擎的角度考虑问题,就觉得这是一个很有必要的措施了。 你也会知道如何发展自己的外部链接。避免 google 的反作弊手段落到你网站上。
还有,关于重复内容,google 一定是“善意原则”优先的,它甚至会帮你处理 掉因为网站大量采用模板带来的重复问题。
要做到了解这些,就是不断的实践,学习和实验。
最近的美剧《Lie to me》非常好看,有一个印象我很深刻,就是他们会定期做 一些实验,来了解人类各种复杂微妙的表情后面隐藏着怎样的心理活动,会定期 形成报告。这是一种非常好的研究程序。
面对 google,我们就像那些心理学家面对人类的心理一样,很多东西是你不了解 的。你去测试,就能得到独家的资料和信息。这也是我博客很多东西的来源。
上篇博客中提到的那个GSA,就是一个绝佳的测试工具,具体的做法还是以后再 讲。