[转载]如何反制互联网精准广告定向

说明:本篇转自月光博客中的《如何反制互联网精准广告定向》,作者fcerebel从用户的角度出发,给出了用户如何阻止广告跟踪的方法。也从另一个角度阐述了精准广告的技术原理,因此转载过来以使大家更好的理解精准广告。感谢fcerebel。以下是正文:

介绍用户一方可以对精准广告定向进行的审查。这样有一个平衡:广告商是自由的,用户也是自由的,双方都能,且应该对它们手上的信息进行审查。那么,用户如何反制互联网精准广告定向?

这篇投稿是补充牛国柱的《互联网精准广告定向技术》,在作者前一篇文章《是谁在偷窥我们的网络隐私》已简单介绍了广告统计的原理,《互联网精准广告定向技术》则给出了详细说明。

放任追踪的后果:
作者在某个社交网站用目前使用的邮箱注册了帐号a。有一天用老的email注册了账户b并登入,该社交网站第一个提醒我应该加的好友就是a。
它其实知道b和a是同一个人。
这就是社交图谱,更广泛地说,是用户(没有注意到而提供的)信息价值。

再回到牛国柱的文章,这篇文章脉络很好,按照广告追踪所涉及的不同“门路”进行分类。本文也以同样的分类,来介绍根据“门路”不同,用户如何对它受到的追踪进行审查。

1,Http Header之User-Agent
有了UA,网站才能根据你希望的语言,版面(手机版?桌面版?)向你提供网页。它在广告上的用途无非是大致统计使用者的浏览器,操作系统,语言等元信息。
UA只是一个明文字符串,浏览器通常都允许将其自定义。通过扩展程序,可以按照网站域名(或其它几乎任何条件)伪造不同的UA

2,Cookie(包括flash cookie)
在广告行业以外,Cookie也是必不可少的东西。它几乎是让服务器记住你的唯一方法:登录,记住你最后一次访问的页面(为什么优酷记得你上次把视频播放到哪里?),账户鉴权保密(支付宝怎么确保你是按照自己的意愿付款?)……都需要用到它。

单纯地禁止cookie往往会造成灾难。所以审查cookie需要一些技能和工具:

第一方/第三方:为了营销而进行的用户追踪功能通常是第三方(的域名)提供的,所以第三方cookie更可能用于追踪。但是对于一个特大号的服务/系统而言,第一方和第三方的区别就会模糊。

用户信息和服务内容可能会分别存放在不同的域名下。如,在阻止所有第三方cookie时,可能会在登录hotmail/skydrive等微软live服务时出现困难。这种情况下,可以通过设定按照域名、第一方第三方、是否一旦退出浏览器时便抛弃等不同来区分黑/白名单,

提供追踪与其它功能的代码来自同一个域名。这种情况下,审查就会变得困难,往往需要直接针对特定cookie进行处理。目前的网页设计都推崇内容和样式分离的异步模式,因此,执行不同任务的javascript通常也会分开,以.js文件的形式发放。这时可以通过阻止特定javascript代码文件的方法以进行来自用户的审查。

Adobe公司和浏览器开发商进行了合作,以确保用户可以轻松地审查flash cookie;现代的浏览器可以审查flash(原生的点击播放功能,或通过扩展程序),以及flash cookie等(其它的plugin也是一样)

3,定向技术
a,所有通过UA的来源都是可以伪造的
b,通过地域(ip地址)的定向难以伪造,只能通过使用代理服务器进行匿名化。
c,回头客,频次定向是利用cookie的,因此第三方的回头客定向比较容易排除,但那些需要用户登录的站点,几乎不可能审查。因为明确标明了“你的”登录历史一定会出现在对方的服务器日志里。但基于网页异步执行的特点,通过审查javascript,还是有机会能减少被搜集的信息量。
d,人群定向是难以审查的,因为这种定向主要来源于你的活动历史,以及你周围(同一类)用户的活动历史
e,并发/时段/网页/关键词定向,这些内容往往是由服务器完成,除非用户能阻断用于提交信息的可执行代码(通常是javascript),否则不太可能审查它们。

4,Do Not Track Header(不要追踪)
DNT也是现代浏览器的一项功能。(唯一的例外是所有源自Chromium的浏览器,包括Google Chrome均不支持)

如果你是twitter的用户,则可以放心地使用DNT功能,twitter已经宣布支持识别DNT。

为什么?

技术上,Do-Not-Track做了这些事情:
当浏览器访问一个网站时,它在向目标网站发送的HTTP header中增加了一句“DNT: 1”
所以是否将带有DNT header请求的用户做别的处理,完全是服务商单方面的事务。

5,浏览器
以上的方法通常都能用于桌面浏览器。移动终端上的浏览器,特别是应用(APP)中内置的统计是难以审查的。
相对简单的方法是,在移动设备的host中,将用于追踪的服务器域名导向一个无效的Ip地址(如指代本地的127.0.0.1)。显然这么做,至少会丧失设备的保修。

如果和广告过不去,记得把它的追踪部分也审查掉,虽然你不会马上感到差异,但这是广告的命根。(完)

说明:我对于作者的“人群定向是难以审查的,因为这种定向主要来源于你的活动历史,以及你周围(同一类)用户的活动历史”说法不太同意,因为目前的人群定向也是通过cookie来维系用户和存储的活动历史的,因此当cookie被清除后,也就无法确定用户的属性了。

5 thoughts on “[转载]如何反制互联网精准广告定向

  1. 关于人群定向的问题,为什么我觉得它的匿名性要差一些,是因为很多时候人们会主动地以同一个身份(这个是要登录的,比如通过sns,新浪微博,淘宝客,专用的客户端软件,这里的cookie就无法避免,而且服务器的后台总是有访问记录在案,这种第一方的统计可能是不太好避免的)进行长期地行动,这么一来这个帐号的行为便可预测,这不就是跟踪的目的么

    1. 如果我们是媒体或是应用,对账号进行监测是方便的,但这样只能得到用户在本媒体或应用中的数据,不能得到全网数据。如果是第三方公司,只能是通过cookie进行监测,只有cookie是能跨网进行追踪的。但实际中,媒体也不敢随意的用账号进行监测,用户隐私还是比较敏感的。

回复 牛 国柱 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注