October 19, 2004
如何防止google adsense fraud clicks(欺骗点击作弊) 的分析::[View]

本文我不希望随意转载,因为我相信大部分的人不明白我在讲什么,如有没有经过允许转载本文,请你们自动删除。
卢亮 2004
随着在线广告的流行,pay by per click (每次点击付钱)的模式 逐渐被大家接受。可是随之而来的问题就是fraud
clicking的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。
下面介绍Google Adsense系统如何从系统角度出发防止点击欺骗,希望对其它的在线广告系统防止虚假点击能有很好的指导作用:
1] 点击率 = 点击次数/共浏览的次数。
点击率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的点击率超过10%将意味这什么。
#of Click/# of Viewed
2] 点击覆盖率/独立IP ,这个分布里如果有;单个IP 的(点击/浏览)=点击覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。
例子,例如来自 129.119.200.1 的用户浏览了 16个网页,点击了4个广告,而整个广告的点击率「从[1]里计算的到」是5%,那么计算得到:
%5 X 16 =~ 1,方差为Sqrt(1) = 1,点击覆盖率=4/1 = 4 ,根据数学上高斯分布,这种概率小于万分之一。
Ratio VS IP distribution
3] 点击率『点击覆盖率』/IP/时间
根据时间序列对点击率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗点击的可能。
Ratio VS time
4] 网页load的时间和 广告点击时间差的分析,以及每两次click之间时间差序列的分析
[网页load的时间和 广告点击时间差] 应该是一个泊松分布 possion
distribution,而每两次click之间的时间差也应该是一个Possion
distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。
[time of loading - time of click] distribution VS Possion
[time difference of two clicks] distribution VS Possion/Gaussion
5] 针对Proxy点击的分析
改变IP进行点击可以说在以往是最难以解决最难以发现作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假点击的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。
Reverse Proxy check
6] 针对 http_agent的分析
Http_agent/时间 的时间序列的分析,峰值超过3方差需要审查
7] 针对 http_referral 的分析
referral/时间 的时间序列的分析 ,峰值超过3方差需要审查
8] 整体效果上还有一个非常有用的量:
所有用户的有效的每千次展示费用的均值/独立IP
这个将能更加直接找到spam clicking 的运行计算机并且予以封杀。
Overall Ratio VS IP
即便我在这里给出了以上的防止作弊的办法,但是不要忘记了:
邪恶的人永远比正义的人来的多,来的猛烈。
推荐阅读:
Google Adsense 如何增加点击率
Google Adsense 广告如何申请及推广
Comments
只是好奇,你是如何知道Google Adsense系统如何工作的?
Posted by: luyi at October 22, 2004 05:44 PM from 70.25.168.53道理很简单,因为我自己也是设计搜索引擎的,这些基本技术不拥有怎么混啊?
Posted by: 6e at October 22, 2004 05:57 PM from 129.119.200.36经过2个月的优化运营,把“阿里巴巴”这个关键词排到了GOOG和BAIDU的前6,6E能帮忙把它排到前3吗?:)
Posted by: 2088 at October 28, 2004 01:11 PM from 221.232.80.1402088,问你1个问题:
1] 每天有多少人搜索阿里巴巴这个关键词?每天有多少人又是因为搜索了这个关键词而到达你的网站的?
因此这个关键词并不重要。
2] 我不做SEO,不过可以给你一个建议,你的那个叶面里面再出现20次阿里巴巴这个词,信噪比提高后你会看到效果。
Posted by: 6e at October 28, 2004 01:21 PM from 129.119.200.36