Skip to content

牛国柱

欲成国柱,须勤耕田

  • 首页
  • 专题
  • 分享
  • 关于
  • 每周一句

Category 数据挖掘

  • 首页   /  产品经理
  • 分类归档: "数据挖掘"
数据挖掘, 网络广告 4 月 20,2013

了解eXelate

同BlueKai一样,eXelate也是一家数据管理及交易公司。eXelate是一个专门为实时竞价广告行业提供数据和分析来帮助他们进行人群定向和竞价决策的公司,它成立于2007年,在纽约、芝加哥、伦敦、巴黎都有着它的分支机构。算上该公司2010年B轮融资的1500万美元,公司总融资额达3200万美元。

打开eXelate网站后,会发现一个有趣的flash,eXelate藉此来表达自己对数据的理解以及对数据认识,那就是好的数据+好的分析+好的使用=好的决策。

 

eXelate将数据分为两类:Syndicated Data和Premium Data。
Syndicated Data:可以理解为数据合作伙伴直接出售的数据。这些数据通过eXelate’s DataLinX™ platform进行出售(eXelate’s DataLinX™ platform兼具DMP和Data Exchange的功能)。数据是由数据所有者直接、透明的与广告客户进行交易。

这个平台的数据提供者有:

alliant autobytel bizo
homeaway nielsen v12
Nielsen Catalina Solutions MasterCard Acxiom
Forbes TruSignal IXI
AdAdvisor

Premium Data:可以理解为有保证的数据。这些数据全部经过第三方认证公司——comScore的审核和认证,确保数据的准确性。
eXelate的数据贯穿了整个购买过程,这些数据有超过900种的属性、行为及购买意图等维度的分类。比如:汽车购买者、购物、属性-年龄、旅游、属性-性别、生活阶段、金融-小商业、收入水平等。

数据购买者可以通过以下与eXelate的合作媒体,来使用Premium Data的数据:

data-delivery-partner-logos

eXelate数据交易方式
eXelate的所有的数据都通过eXelate’s DataLinX™ platform进行交易。对数据拥有者来说,可以选择透明和匿名两种数据交易方式。
透明交易:如上所述,是数据拥有者直接与数据购买者进行交易,数据拥有者可以设置售卖策略、底价以及隐私保护等,当然,交易是系统撮合的。估计eXelate也会从交易中收取一定比例的费用。

匿名交易:是指eXelate平台将所有相似的数据整合起来,匿名进行售卖。这种方式下eXelate参与度更大,费用收取的比例应该更高。

eXelate的数据分析
eXelate宣称自己拥有一个世界水准的数据科学家团队、健壮的数据分析基础架构以及拥有专利的建模算法。最终形成的数据分析产品叫maX data™。maX data™ 是modeled audience eXtension的意思。maX data™包括两个产品:maX Models和maX Index™。
maX Models:包括maX Performance™ 和maX Brand™ 两个模型。
maX Performance™ 注重效果,以之前投放中效果较好的数据为参照使本次投放达到更好的目标值。
maX Brand™ 注重到达,以用户兴趣为依据使本次投放到达更多对所宣传品牌感兴趣的消费者。

maX models超越了重定向的局限性,并且可以在任何平台上灵活的进行定向。当然,数据分析的结果属于数据所有者,eXelate不会将数据分享给其他公司。
funnel-new

maX IndeX™– Deep audience insights
从介绍来看,maX Index™ 看起来仅仅是一个报告,是对广告投放活动效果的确定。maX Index™ 是基于投放的第一方数据,对优于目标的人群进行标注,以此帮助客户在投放中进行聪明的决策以及提升未来的投放效果。

eXelate的隐私保护
隐私保护一定是数据交易公司工作的第一要务,eXelate也是如此。
eXelate隐私保护的总的原则是透明、可知和可控,并且对数据的收集方法、用户opt-out选项、数据售卖及整合以及为购买者提供安全的数据等进行了说明,详细了解可以查看http://exelate.com/consumer-opt-out/data-philosophy/。
 

作者 牛 国柱
数据挖掘, 网络广告 3 月 30,2013

了解BlueKai

BlueKai是国外一家做数据买卖的公司,没错,就是315晚上上曝光的用户跟踪,买卖数据的生意。在对隐私保护更注重的美国,BlueKai生存的很好,没有倒掉,也说明了互联网的用户跟踪并非是过街的老鼠、不能见到阳光的黑色地带。当然,这也和BlueKai严格遵守法规、尊重用户的设置有关,下面会谈到。

BlueKai主要有4个产品:DMP(Data Management Platform)、Data Exchange、Audience x Media Analytics及Mobile DMP。

1、DMP,用来组织第一方数据并且在DMP合作的网站中使用这些数据
2、Data Exchange,通过使用第三方的在线以及离线数据来创建新的可扩展的受众,并且使用这些受众。

  • 活跃用户超过3亿
  • 前20位的广告网络、门户网站、trading desk中有80%在使用BlueKai的数据
  • BlueKai的创建了超过30000种数据属性,为品牌宣传和营销计划服务

3、Audience x Media Analytics,通过分析受众和媒体的数据,帮助营销人员更放心的制定市场计划、定向用户、优化活动、购买媒体。
4、Mobile DMP,顾名思义,为移动端的DMP产品

从介绍来看,这4个产品主要的特点是:
1、DMP

  • 收集整合线上线下的数据(用户的自有数据)
  • 对数据进行划分(可以针对不同的营销活动,如展示、搜索、视频、社交广告等)
  • 将数据用于投放(可投放到不同的广告网络和交换平台)
  • 衡量投放效果(可视化),不断进行优化

2、Data Exchange
data exchange
关于数据提供方以及数据类型可以见附件的说明。

3、Audience x Media Analytics

  • 根据现有用户,通过人口统计、地域、兴趣及市场属性等方法找到与现有用户有相似属性的用户
  • 基于已知的第一方数据,优化用户和媒体的组合

4、Mobile DMP
是一个全面的、基于云计算的平台,能够管理第一方和第三方移动数据,并且对受众数据进行深度分析。

通过以上产品,BlueKai为营销人员、媒体、代理公司以及数据提供商提供服务。BlueKai也通过提供这些服务赚取利润。

能够公开进行数据买卖,和美国法律完善有关,也与BuleKai的数据使用对用户透明有关。
1、用户随时可以选择opt-out。
2、明示遵守了那些法律法规。
3、明确了收集与不收集哪些数据。

What we MAY KNOW about you What we DON’T KNOW about you
>Age Range
>Gender
>Marital Status
>Military Status
>Language you speak
>Education level
>Occupation
>Age range, gender and approximate number of >children in your household
>Health and Wellness information (if you express an interest in yoga, or healthy living)
>Housing information (rent, own, etc.)
>Financial information (if you have a mortgage, pay your bills online, looking for a car loan, etc.
>No personally identifiable info (PII)

  • Name
  • Email address
  • Mailing address
  • National identification number (ie: SSN)
  • Birth date/Birthplace

>Credit card numbers
>Driver’s license number
>Personal Health Information
>Religious beliefs

4、BlueKai允许使用者看到自己的资料是被谁在使用,并且可以将因为使用自己数据获得的收益捐给慈善机构,很有意思。

附:

Data Exchange中的数据类型及提供方:(http://www.bluekai.com/bluekai-exchange.php)

Data Type Description Source Availability Qualification Segmentation
Intent Consumers who intend to buy a particular product or service in the near term.
Exclusive
BlueKai Intent
160+ million uniques Actions indicating intent to buy on top tier ecommerce, financial, retail, online travel agency sites. Sample actions include interactions with a search function (either via search widget, or entering in a keyword), product comparison, loan calculators, etc. Autos (ie. by Make and Model)

Financial services
 (ie. loans, mortgages, investment products)

Travel
 (ie. by departure/destination city, length of stay, air travel, hotel, rental cars and brands)

Education
 (ie. by education products and services)

Retail 
(ie. by product type, categories, brands)

Local Goods & Services
 (ie. by products and services)
B2B Business consumers who are occupationally similar.
Exclusively
bizo
12+ million uniques Occupational attributes sourced from hundreds of business web sites Company size Functional area Industry Seniority
Past Purchases Consumers who are more likely to buy based on pervious purchasing habits addthis

alliant

bizo

datalogix

expedia

forbes

i360

ixi

lotame

polk

transunion

trusignal

v12

65+ million uniques Consistency in online and offline shopping behaviors By Product Type (e.g. Women’s Apparel, Laptop )
Geo/Demo Geographically or demographically similar. TBD Geo: By State
Demo: Age, Education Level, Gender, Homeowner Status, Household Income, Presence of Children
Interest, Lifestyle Consumers who are more likely to be interested in a topic or fall within a lifestyle category based on modeling from multiple data types 103+ million uniques Consistency in online and offline shopping behaviors contrasted with demographic attributes to determine interest, hobbies and lifestyles. By Product Type (ie Women’s Apparel, Laptop)

By Lifestyles (e.g.
Frequent Travelers, High Spenders)

By Generations (e.g. Gen X, Baby Boomers)

By Social (e.g. Social Behavior, Social Signals, Interest between Friends)

Branded Consumers sorted by branded sources of data ranging from geo/demo, lifestyle, interest and purchase propensity TBD Contact BlueKai to get a comprehensive list of data providers Contact BlueKai to learn more about our branded data providers
Estimated Financial/Economic Consumers grouped by their estimated financial characteristics v12 n/a Developed from IXI’s proprietary measures. Examples include Income, Discretionary Spending, Economic Cohorts, Economic Spectrum, Ability to Pay, etc.
作者 牛 国柱
产品经理, 数据挖掘 9 月 11,2012

关于数据挖掘

以下内容来自网络,关于数据挖掘的一些最基本的知识。

 
数据挖掘是对一系列数据进行分析和挖掘的方法的统称,在精准营销领域,最常用的数据挖掘方法主要包括以下三类:分类、聚类、关联。数据隧道

分类(Classify)属于预测性模型。分类模型的构建需要“训练样本”,训练样本中的每一个个体的类别必须是明确的。分类模型的特征变量一般称为“自变量”,又叫“预测变量”,类别变量称为“目标变量”。分类模型采用的方法有:决策树、Logistic回归、神经网络、判别分析等方法。

聚类(Clustering)属于非预测模型(描述性模型)。聚类模型是将特征相似的用户归在一个组里,特征不同的用户分在不同组。聚类模型不需要“目标变量”,只需要给定自变量。选择聚类所需的变量是构建聚类模型最关键的工作,变量的选择往往取决于应用的目标要求。

关联(Association)也属于非预测模型,主要解决的问题是研究产品购买的关联性,即买A产品的同时是否会对B产品也很感兴趣。经典的数据挖掘案例“啤酒和尿布”就属于关联模型。

关联模型中度量两个产品关联性强弱主要用三个指标:支持度、可信度、提升度。

针对两个商品A、B,研究A–>B的相关性,三个指标的定义如下:

支持度(Support):表示A、B同时购买的人数占总购买人数的比例。支持度越高,表示A、B商品同时购买的人数越多,这两个商品越主流。

可信度(Confidence):表示在购买A商品的人中同时购买了B商品的比例。可信度越高,表示购买了A商品后再购买B商品的可能性就越大。

提升度(Lift):可信度除以总用户中购买过B商品的用户占比。提升度越高,表示购买了A商品对购买B商品的影响度就越大,也即他们之间的相关性就越强。

关联模型可以解决两大类问题:1、如何对用户进行商品推荐?2、把哪些商品捆绑在一起销售更好?前者我们叫“交叉销售”的问题,后者叫“捆绑销售”。

在互联网广告行业快速发展进化的今天,对用户网络行为进行跟踪,并利用数据挖掘技术还原用户自然属性、描述用户意图,进而指导广告主精准投放已经成为行业大势,随着越来越多的Data Provider的出现,独立的第三方数据大鳄DMP平台也会很快浮现。当DMP平台出现时,意味着中国的互联网广告行业彻底进入用户投放时代,这才是大的变革。作为变革的必要条件——数据挖掘技术,作为广告产品经理,有必要对其增加了解。

 

作者 牛 国柱

Proudly powered by WordPress | Theme: BusiProf by Webriti