2012 年 3 月 – 牛国柱

精准广告 3 月 24,2012

用户追踪之基础技术——Cookie

前言

Cookie是如此的重要，以至于我们后面要讲到的回头客定向、访客频次定向、用户定向等等都需要基于此技术才 cookies 可以实现，并且我们日常工作中所能见到的第三方监测工具如doubleclick、99click、秒针等也都要利用cookie技术，网站分析工具如GA、百度统计、CNZZ等也需要利用cookie。如果没有Cookie，互联网广告市场将受到巨大打击，尤其对于目前我们谈论的精准广告而言。如果没有Cookie，网站分析也不从做起，遑论优化了。

Cookie是什么

Cookie在英文中是小甜品的意思，但在计算机语言中，Cookie指的是当你浏览某网站时，网站存储在你电脑上的一个小文本文件，伴随着用户请求和页面在 Web 服务器和浏览器之间传递。它记录了你的用户ID，密码、浏览过的网页、停留的时间等信息，用于用户身份的辨别。Cookie通常是以user@domain格式命名的，user是你的本地用户名，domain是所访问的网站的域名。

为什么要Cookie

因为HTTP协议是无状态的，对于一个浏览器发出的请求，服务器无法区分是不是同一个来源，无法知道上一次用户做了什么。所以，需要额外的数据用于维护会话。 Cookie 正是这样的一段随HTTP请求一起被传递的额外数据，用于维护浏览器和服务器的会话。我们可以想象一个场景，你没有登录京东时在京东上购物，选择了3件商品放入购物车，在结算时，京东为什么还能知道这三件商品是什么？没错，是Cookie！

Cookie的传递流程

Cookie利用网页代码中的HTTP头信息，伴随着用户请求和页面在 Web 服务器和浏览器之间传递。例如：当你在浏览器地址栏中键入了Amazon的URL，浏览器会向Amazon发送一个读取网页的请求，并将结果在显示器上显示。在发送之前，该网页在你的电脑上寻找Amazon网站设置的Cookie文件，如果找到，浏览器会把Cookie文件中的数据连同前面输入的URL一同发送到Amazon服务器。服务器收到Cookie数据，就会在他的数据库中检索你的ID，你的购物记录、个人喜好等信息，并记录下新的内容，增加到数据库和Cookie文件中去。如果没有检测到Cookie或者你的Cookie信息与数据库中的信息不符合，则说明你是第一次浏览该网站，服务器的CGI程序将为你创建新的ID信息，并保存到数据库中。（此例子来源于百度百科——Cookie）

关于Cookie的一些知识点

1、Cookie是基于浏览器的，因此当电脑上安装多个浏览器时，服务器会生成多个Cookie。虽然是同一个人，但服务器是识别为多个用户。
2、Cookie是基于浏览器的，因此当同一台电脑有多个人使用时，服务器也只会生成一个Cookie。虽然是多个人，但服务器会认为是一个用户。补充：在多个人均登录账户时，服务器可以以账户为区分，为每个账户生成单独的cookie，比如多人用同一台电脑登录新浪微博。（感谢数据挖掘_PHP的指正）
3、Cookie是无法跨设备进行设置的。比如我们在单位和家里分别使用两台电脑，即使我们使用同一种同一版本的浏览器，我们还是生成了两个Cookie，服务器会认为是两个用户。（PS：现在有些浏览器可以同步数据，比如Chrome、Friefox，可以避免这种问题）

请注意：以上所说的Cooke指的全部是Http Cookie。有一种Cookie——Flash Cookie，可以解决多浏览器的问题。

关于Flash Cookie

FlashCookie是由FlashPlayer控制的客户端共享存储技术，鉴于目前Flash技术的普遍性，几乎所有的网站都采用，所以具有同Http Cookie一样的作用。在技术上，通过使用JavaScript与ActionScript可以将Http Cookie和Flash Cookie进行互通。

Flash cookie的优势在于：
1、跨浏览器
不管用户的计算机上安装了多少个浏览器或者浏览器的不同版本，使用Flash Cookie能够使所有的浏览器共用一个Cookie。
2、不易删除
所有的浏览器均提供了清除Http Cookie的快捷方式，但Flash Cookie并没有此种方式，并且其保存位置非常隐蔽，网民难以删除。
3、容量更大
Flash Cookie可以容纳最多100千字节的数据，而一个标准的HTTP Cookie只有4千字节。

作为网络广告行业的销售人员，了解以上知识就已经绰绰有余了。如果想了解更多，可以接着往下看。

Cookie的数量

1、大多数浏览器支持最大为 4096 字节的 Cookie。因此最好用 Cookie 来存储用户 ID 之类的标识符，用户的详细信息则通过用户 ID从数据库或其他数据源中读取。
2、浏览器还限制站点可以在用户计算机上存储的 Cookie 的数量。大多数浏览器只允许每个站点存储 20 个 Cookie；当存储更多 Cookie时，最旧的 Cookie 便会被丢弃。有些浏览器还会对它们将接受的来自所有站点的 Cookie 总数作出绝对限制，通常为 300 个。

Cookie的失效时间

1、浏览器的Cookie设置会决定是否保存Cookie数据。如果浏览器不允许Cookie保存，则关掉浏览器后，这些数据就消失。
2、如果浏览器允许保存Cookie，那么Cookie的时间由服务器的设置决定。Cookie有一个Expires（有效期）属性，这个属性决定了Cookie的保存时间，服务器可以通过设定Expires字段的数值，来改变Cookie的保存时间。如果不设置该属性，那么Cookie只在浏览网页期间有效，关闭浏览器，这些Cookie自动消失，绝大多数网站属于这种情况。通常情况下，Cookie包含Server、Expires、Name、value这几个字段，其中对服务器有用的只是Name和value字段，Expires等字段的内容仅仅是为了告诉浏览器如何处理这些Cookies。

Cookie的样例

1、Cookie的名称

2、Cookie的内容

3、从页面代码监测工具看Cookie
cookie的查看

Cookie的位置

1、Http Cookie的位置
Windows 9X系统 C:WindowsCookies
Windows NT/2000/XP系统 C:\Documents and Settings\用户名\Cookies
win7系统 ?C:\Users\*\AppData\Roaming\Microsoft\Windows\Cookies\*
OS X系统～/Users/用户名/Library/Cookies

2、Flash Cookie的位置
非Win7系统
C:\Documents and Settings\[username你的用户名]\Application Data\Macromedia\Flash Player\#SharedObjects
Win7
C:\Users\[username你的用户名]\Application Data\Macromedia\Flash Player
其中：Users可能显示为“用户”
OS X系统
~/Users/用户名/Library/Preferences/Macromedia/Flash Player/#SharedObjects
~/Users/用户名/Library/Preferences/Macromedia/Flash Player/macromedia.com/support/flashplayer/sys/

第一方Cookie和第三方Cookie

大多数的第三方监测工具和网站分析工具都会采用第三方Cookie。所谓第一方和第三方的说法，是用来确定Cookie的归属的，这个归属是指Cookie中记录的域（domain）。第一方和第三方的唯一区别只是：Cookie中的域名是否和被访问网站的域一样，是就是第一方，否就是第三方。举个例子：如果你访问网站www.chinawebanalytics.cn的时候，网站在你的电脑上设置了一个Cookie，里面的记录的域名也是www.chinawebanalytics.cn，那么这个Cookie就是第一方的，归你访问的网站www.chinawebanalytics.cn所有。而如果你访问网站www.chinawebanalytics.cn时，在你的计算机中设置的Cookie的域名是www.abc.com，那么这个Cookie就是第三方Cookie，归www.abc.com所有。

第一方Cookie并不一定需要由某个网站自己的服务器给自己建立，别的网站也能为它建立；而且，第一方Cookie也不一定是能由某个网站自己读取的，它完全可能由第三方读取。（以上内容和例子来自于捍卫Cookie——没有Cookie，我们什么都没有了）

作者牛国柱

网络广告 3 月 17,2012

互联网广告计费方式介绍

无论何种商品的售卖，除了价格外，还必须有价格的衡量标准（即价格的单位），比如iPad，3688元/台。从1994年互联网广告出现到现在，产生了很多不同模式的计费方式。
我们来介绍目前最主流的几种计费方式：

CPC（点击成本）

即Cost-per-click，每点击成本。
按照广告点击付费的模式是互联网广告最早的计费方式，1994年出现的第一支广告就是采用此计费方式。由于广告的点击非常容易作弊，因此CPC计费方式产生的后果就是媒体大量的生成虚假点击欺骗广告主，同时由于广告主更熟悉、更接受电视广告的宣传模式，因此出现了CPD的计费模式，向电视宣传模式靠齐。如果不考虑作弊，单从效果角度考量的话，CPC计费方式比CPD计费方式更加有利。百度竞价以及google竞价均采用CPC的计费模式（也有叫PPC模式，Pay-Per-Click ）。

CPD（Cost per day）

即按天付费。
此种模式完全参考电视广告的宣传方式，重展现，讲品牌曝光的范围（更广的地域或人群）及深度（到达频次），也以电视广告的指标来衡量效果，比如iGRP等。但采用此种计费方式的媒体必须有强大的用户群体支撑，而且必须具有很高的知名度及美誉度，否则广告主并不买账，因此也只有几个门户网站采用这种计费方式。对于垂直类媒体以及广告网络而言，采用了CPM的计费方式。

CPM（千人成本Cost per Thousand Impressions）

即广告主为它的广告显示1000次所付的费用。
需要说明的是，CPM中的M指的是Mille，希腊文中千的意思。互联网行业，是长尾法则发挥力量的行业，除了少数的大广告主可以hold住CPD的计费方式外（此方式的价格高的吓人 SINA的价格 SOHU的价格），大量的中小广告主往往因为价格的原因放弃网络上的投放。有需求就会有解决方案，CPM计费的方式就产生了。CPM方式与CPD方式的核心区别在于按量投放，按量计费，广告主只需要为自己需要采购的播放量付费，解决了中小广告主的价格困局，因此受到市场的欢迎，CPM是目前垂直类媒体以及广告网络的主流计费方式。

但CPM的M就一定是广告的展现吗？答案是不一定，因为我们要按照广告形式来区分。如果是基于网页的固定位置展现的广告，如Banner、PIP等形式，M指的是页面的PV量，至于访客是否真正看到了广告，并不一定。如果是浮层类的广告，此时M的值指的就是广告的展现量。

CPA（Cost per action）

由广告所带来的用户产生的每次特定行为的费用，即根据每个访问者对网络广告所采取的行动收费的定价模式。对于用户行动有特别的定义，包括形成一次交易、获得一个注册用户、产生一次下载行为等。
网络广告的计费方式随着市场的变化而变化。随着网络游戏、电子商务的兴起以及重视长尾流量的网盟的发展，CPA的计费模式产生了，此模式直指游戏、电商广告主最核心的需求——产生注册及订单。从定义上来讲，A是投放前广告主和媒体协商制定的，因此A可以是注册，可以是下单或者可以是点击某一个特定按钮、可以是提交问卷等多种形式，只要定义好，双方认可，并且双方都可以监测到相应数据即可。

CPS（Cost per sale）

即为基于广告引入用户所产生的成功销售而收取一定比例佣金的商业合作方式。
CPS模式是CPA模式的一种特定形式，在国内常用作电商广告投放时的计费方式，意思是只有在电商获得订单的时候，媒体才会得到推广费用。CPS有两种收益计算方法，一是按照订单额的比例计算，一是不区分订单额，每个订单有固定价值，订单固定价值乘以订单量即为广告主的收益。

ROI (Return on Investment)

投资收益率或报效回报率。现在多用于电商、游戏类用户考核广告效果的标准。一般计算方法是由广告产生的收益额/投放额。
ROI方式是CPS方式的另一种表示方法。举例来讲，如果一个电商的合作ROI是1:2，其意思指的是广告主愿意支出其订单额的50%（1/2）付给媒体。
作为约定俗称的做法，当电商网站和联盟合作时，会讲用CPS结算，一般比例在10%以下，而和门户网站以及有一定品牌价值的媒体合作时，会讲用ROI结算，一般为1:2或者1:1，甚至会有1:0.8，可以看出广告主让利比例非常大，因为此时有品牌宣传的考虑在里面。

以上为目前国内网络广告市场主流计费方式的说明，除了这些方式以外，还有CPE（Cost-Per-Engagement）、dCPM（dynamic CPM）等一些方式，因为不主流以及更难理解，不做解释。

作者牛国柱

精准广告 3 月 10,2012

网络广告定向技术介绍——地域定向

地域定向依赖于对IP地址的识别，而IP协议是互联网的基础协议，因此从网络诞生的第一天起，地域定向就可以被使用了。
欲详细了解IP协议，请查看百度百科——TCP/IP协议。
有关IP地址的详细信息，请查看百度百科——IP。

通俗来讲，IP地址就是互联网上的门牌号，接入互联网的所有主机就是我们的一个个住所，其中有个人的，有单位的。个人住所一家一个门牌号，单位的多家公用一个门牌号，由于规划的原因，有的住所会有多个门牌号，也是规划的原因，门牌号有时会发生变化。IP地址也有此特点，一台主机可以具有多个IP地址，而多台主机也可以公用一个IP地址。

现实中，不管如何规划，通过门牌号我们能找到我们要找的住所，也能清楚住所所在的具体位置。同样，在网络中，通过IP地址我们也能定位到我们所需要找的主机，并且清楚知道主机所在的地理位置。这样我们就能进行广告的地域定向了。

从技术层面讲，地域定向的工作逻辑是：
当一个请求发送给服务器时，服务器根据配置（以Apache为例，在Apache Httpd中进行配置）记录下请求的相关数据，组成日志文件，日志基本会包括请求时间、请求IP、请求的URL、请求的Reffer、请求的User-Agent以及其他信息，将收集到的IP地址与已有的IP数据库进行比对，即可以确定请求者的地理位置了，比如山西省太原市。当然，请求的IP信息从http协议中可以获取，不是必须依赖于日志。（感谢数据挖掘_PHP的指正）

国内目前免费的IP库有QQ IP数据库纯真版，即我们通常所说的纯真IP库，收集了包括中国电信、中国网通、长城宽带、网通宽带、聚友宽带等 ISP 的最新准确 IP 地址数据，包括最全的网吧数据。IP数据库每5天更新一次，企业可以在此基础上修正后使用。

目前的地域定向更多的是针对省份以及地级城市的定向，针对县级市或者区级的定向基本上都十分不准确。

作者牛国柱

Archive 2012-03-24