• [转载]渠道商用假量冒充真实用户:开发者求给条活路

  by  • 2012/08/15 • 反作弊, 移动广告 • 4 Comments

  说明:之前在《[转载] 在线广告作弊手段一览》和《[转载]Facebook广告陷入信任危机:虚假点击泛滥》两篇文章中,我们介绍了Web媒体如何作弊和识别广告点击作弊的方法,那在移动互联网中是否存在作弊呢?答案显而易见。本文的作者就为我们描写了是如何识别APP付费推广作弊的。同样,我们重点来学习作者的分析思路。原文链接是:http://www.leiphone.com/0731-utlee-app-channel.html

  正文开始:

  光盘机器人创业者很苦鳖的,苦于创意,苦于开发,苦于用户体验。

  创业者很苦鳖的,就算把产品做好了,不推广也很难获得用户。

  创业者很苦鳖的,遇上无良渠道商,花钱做推广,花时间做换量,可产品还是不见起色。

  看看一个同样苦鳖开发者的自述吧。

  我做数据挖掘技术出身,并从事推广工作三年,App付费推广的作假现象已屡见不鲜,

  这次终于长见识了,见过作假的,没有见过那么扯淡的。

  数万元推广费用,获得上万激活量,只有7个真实用户,当然,还不排除这7个“真实”全是这个坑爹渠道的测试人员,产品、运营、商务的亲们千万小心了:

  我所在公司长期做App的换量及付费推广,最近上线一套智能算法用来甄别假量,发现某“渠道A”(该渠道真实名称可向赵童鞋私下询问)严重作弊刷假量。先来看看该渠道A最近一周的数据(注:因涉及产品机密数据,隐去了具体数值,仅表现大体趋势。下述所有图表均如此):

  • 注册率
  • 留存率
  • 启动次数

  (1)注册率

  注册率

  (2)一次留存用户

  一次留存用户

  (3)启动次数(平均每人每日)

  启动次数

  所有数据无明显异常,从数据上看,还是个“高质量渠道”。不甘心?!?!再多些深度数据(最近一周):

  • 用户流失速度
  • 用户回访间隔
  • 铁杆用户比率

  (1)用户流失速度

  用户流失速度

  (2)用户回访间隔

  用户回访间隔

  (3)铁杆用户比率

  铁杆用户比率

  常用的数据都查了,还是没有确凿的异常!好吧,不管愿意不愿意接受,苦逼的现实是:

  传统的数据指标已区分不出作假的渠道了。

  怎么办,还有没有数据能够让作假无处遁形的?有!比如用户的应用使用时长

  可以设想一下,刷假量的机器人毕竟不是真实用户,它们完成“指定”的操作任务后,不会再因为看到美女就猛点她的头像,也不会玩爽了再多玩会儿。那么来看一下用户使用时长曲线对比:

  用户使用时长

  渠道A的使用时长远低于整体平均值(其他渠道),且没有随着日期形成周期性规律震荡。总算是露马脚了,完全可以确定是机器人刷假量

  机器人刷假量,应该是能找出特征的。按以前的做法是对比IMEI号,但现在的刷量机器人却早就能伪造假IMEI了。

  但依然可以根据IMEI寻找机器人特征,正常渠道的IMEI号极少重复,且重复的概率不随时间推延而增大;而作弊渠道的IMEI重复率往往较高,且随着时间不断增长。

  IMEI重复率曲线

  可以实际上IMEI数据还是不能看出异常,需要再想别的办法。不同用户的手机,是用的不同通讯运营商(诸如移动、联通、电信)的电话卡,通过统计运营商有希望找出机器人特征。为了做分析,抽样了一小撮用户,提取了他们的运营商信息,统计结果显示:

  渠道A运营商分布

  其他渠道运营商分布

  看来通过运营商的情况是分析不出机器人特征的。而我又抽样部分用户IP地址,不管是IP分布还是IP跨省概率都与正常用户一致

  一个血淋淋的现实摆在了眼前:

  假用户的仿真度越来越高,识别它越来越难,而提取作假特征几乎已不可能。

  当然,没有苦鳖青年走不通的路,最终我们公司还是完成了取证。

  抽样提取了该渠道部分Android用户所安装的App列表,发现很多用户安装的App是一模一样的。再深挖这个猫腻,结果得知:

  A渠道,一共制作了4组机器人,每组机器人数量若干,同组内机器人所安装的App一模一样,且不增不减。

  APP包名列表

  APP包出现比率

  总算是把A渠道的机器人揪出来了,但是因为法律法规的问题,我们并不能把该渠道怎么样,只能是不给钱,然后将造假消息告诉认识的朋友。

  而且,事件的结果并没有像童话故事一样美满,苦鳖的我们又遇上了更无敌的机器人刷量,而且上述的所有判断方式全部失效。真是道高一尺,魔高一丈。

  至今为止,与我所在公司合作的渠道,有近3成查出了刷假量作弊,从2010年最简单的弱智灌水;到2011年出现智能机器人,开始会模拟真实用户进行注册,还能够回访;再到2012年,机器人已能做到个性化的高仿真。

  而事后想想,这样的渠道能提供如此高仿的假用户,传统的所有数据指标都无效,让普通的开发者完全没办法区分,最大的原因就是因为暴利的驱使,花费数万元获得的上万激活却只有7个真实用户,这黑心钱挣得太犀利了,这几乎是零成本的获利

  而且现在并没有多少家公司在查作弊,作弊的风险的低,且无相关法规约束,作假也变的理所当然了。

  此外,就我所知,做假量的激活cpa,单价仅在1角到7角之间,远低于真量,中间巨大的差价带来了巨大的回扣空间。推广的负责人也许已经发现了作弊,但是受回扣驱使或者是业绩压力,故意隐而不发也是很有可能的。

  总结:

  通过本文,我们可以看到作者的分析思路和指标及各指标可能的公式如下:

  排查的顺序排查的指标可能的公式维度
  1注册率注册量/下载量每天
  2留存率开机量/注册量每天
  3平均启动次数启动总次数/启动唯一用户量每天
  4用户流失曲线符合流失标准的用户数/注册量每天
  5回访平均间隔回访间隔总时长/回访总次数每版本
  6铁杆用户比率符合铁杆标准的用户数/注册量每天
  7人均使用时长使用总时长/使用唯一用户量每天
  8IMEI重复率曲线每日与之前所有IMEI重复总量/每日IMEI量每天
  9运营商分布注册量中某运营商总量/注册量每天
  10APP安装包出现比率注册量中相同APP总量/注册量每天


  wechat recommend欢迎扫描上方二维码关注我的微信公众号

  About

  互联网广告产品经理,潜心于富媒体广告、展示广告、搜索广告领域,熟悉广告系统设计,孜孜不倦的追求广告精准投放技术。 欲成国柱,须勤耕田!

  4 Responses to [转载]渠道商用假量冒充真实用户:开发者求给条活路

  1. 2012/10/10 at 15:58

   现在抓作弊真是越来越难了,永远赶不上作弊创新的速度
   顺便问一下,LZ是用什么方式提取到用户的Andriod App列表的,是你们本身的App获得的吗?

   • 牛 国柱
    2012/10/10 at 16:08

    文章是转载的,我没有做过。但我想应该是是通过自己的APP去获得的用户的Andriod App列表。

  2. Pingback: 常见的在线广告作弊手段 - EC数据分析

  3. Pingback: 部分有关 广告联盟作弊 与反作弊资料收集 - im蚂蚁

  发表评论

  电子邮件地址不会被公开。 必填项已用*标注