08.06.2015 Views

Sponsored Search 概述龚笔宏(云雀)

Sponsored Search 概述龚笔宏(云雀)

Sponsored Search 概述龚笔宏(云雀)

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Sponsored</strong> <strong>Search</strong> 概 述<br />

龚 笔 宏 ( 云 雀 )


Content<br />

• <strong>Sponsored</strong> <strong>Search</strong> 概 述<br />

• <strong>Sponsored</strong> <strong>Search</strong> 技 术 介 绍


<strong>Sponsored</strong> <strong>Search</strong> 概 述


Computational Advertising<br />

• Online advertising<br />

– http://en.wikipedia.org/wiki/Online_advertising<br />

– Online advertising is a form of promotion that<br />

uses the Internet and World Wide Web to<br />

deliver marketing messages to attract customers<br />

• computational advertising<br />

– Find the "best match" between a given<br />

– user in a given context and a suitable<br />

– advertisement.[1]


广 告 的 分 类<br />

• 计 费 方 式 :<br />

– CPT<br />

– CPC<br />

– CPM<br />

– CPA/CPS<br />

• 不 同 的 产 品 形 式 :<br />

– <strong>Sponsored</strong> search<br />

– Display ads<br />

– Contextual Advertising ( 上 下 文 广 告 )<br />

– 无 线 广 告<br />

– Etc.<br />

• 展 现 形 式<br />

– 文 字<br />

– 图 片<br />

– 图 文<br />

– 视 频<br />

– Etc.


<strong>Sponsored</strong> <strong>Search</strong>


<strong>Sponsored</strong> <strong>Search</strong><br />

• 业 界 的 系 统 :<br />

– Google AdWords<br />

– 百 度 凤 巢<br />

– 淘 宝 直 通 车


广 告 系 统 中 的 几 个 参 与 方<br />

• 广 告 主 Advertiser<br />

• 浏 览 者 User<br />

• 流 量 提 供 方 Publisher<br />

• 广 告 平 台


<strong>Sponsored</strong> <strong>Search</strong> 中 的 几 个 角 色 :<br />

几 个 概 念 : CTR /PPC /RPM/CVR/ROI<br />

<strong>Sponsored</strong> search: an overview of the concept,<br />

history, and technology


不 同 角 色 所 关 心 的 问 题<br />

• 广 告 主 的 行 为 :<br />

– 买 词<br />

– 竞 价<br />

– 为 点 击 付 费<br />

• 搜 索 引 擎 的 行 为 :<br />

– Query 分 析<br />

– 展 示 搜 索 结 果 + 广 告 结 果<br />

– 计 费<br />

• 用 户 的 行 为 :<br />

– 搜 索<br />

– 点 击 搜 索 结 果


不 同 角 色 所 关 心 的 问 题<br />

• 广 告 主 的 利 益<br />

• 用 户 的 利 益<br />

• 搜 索 引 擎 的 利 益<br />

• 冲 突 的 地 方 , 如 何 权 衡<br />

几 个 概 念 : CTR/PPC/RPM/CVR/ROI


Timeline for <strong>Sponsored</strong> <strong>Search</strong> Auctions<br />

<strong>Sponsored</strong> search: an overview of the concept,<br />

history, and technology


<strong>Sponsored</strong> <strong>Search</strong><br />

• First price auction<br />

• Second price auction<br />

• Generalized Second Price (GSP)<br />

– Revenue ranking<br />

最 高 出 价<br />

广 告 A 0.4 0.8<br />

广 告 B 0.6 0.7<br />

广 告 C 0.3 0.6<br />

广 告 质 量<br />

出 价 * 广 告<br />

质 量<br />

排 名<br />

广 告 A 0.32 2 0.19<br />

广 告 B 0.42 1 0.33<br />

实 际 扣 费<br />

广 告 C 0.18 3 0.05


<strong>Sponsored</strong> <strong>Search</strong> 技 术 介 绍


<strong>Sponsored</strong> <strong>Search</strong> 技 术 概 述<br />

• Query<br />

– Query analysis & expansion<br />

– query–doc matching<br />

• Ranking<br />

– CTR prediction<br />

– ROI prediction<br />

• Anti-fraud<br />

• 系 统<br />

– 海 量 数 据 处 理<br />

– 高 并 发 & 高 实 时 性 系 统<br />

• 应 用


2.1 Query<br />

• Query analysis & expansion<br />

– 纠 错<br />

- Normalize 归 一<br />

- Topic Identification<br />

- Query similarity<br />

- 结 构 分 析 (term weight、sub topic)<br />

- Query expansion<br />

• 应 用 : exact match vs. advanced match<br />

• 举 例 : only 雪 纺 连 衣 裙


2.1 Query Expansion<br />

• Query expansion source:<br />

– 1. Query logs<br />

– 2. Co-clicks on search results and ads<br />

– 3. Top features from web search results<br />

– 4. click graph<br />

– …


2.1 Query–Doc Matching<br />

• query – document matching<br />

– Precision & recall<br />

– 目 标<br />

• Match 在 搜 索 & 广 告 中 的 差 异


2.1 Query–Doc Matching (Cont.)<br />

• Matching with Dependency Model<br />

• Matching by Query Reformulation<br />

• Matching with Topic Model<br />

• Matching with Translation Model<br />

• Matching in Latent Space<br />

Li H, Xu J. Beyond bag-of-words: machine learning for querydocument<br />

matching in web search


2.2 Ranking<br />

• Revenue maximum ranking ( eCPM<br />

maximum – ranking)<br />

R = p (click|ad,query) * cost<br />

• CTR prediction :<br />

– Training data<br />

– Feature (query 、ad、query&ad)<br />

– Online predict


2.2 Ranking Problems<br />

• Problems :<br />

– Data sparse (both ad impressions and query<br />

frequency power law )<br />

• Cluster<br />

• Group queries, pages, ads into larger groups<br />

– Relevance v.s. CTR<br />

– Position bias<br />

– Noise<br />

– E&E


2.2 Ranking - ROI Prediction<br />

• ROI Prediction<br />

• Problem:<br />

- Return?<br />

– ROI v.s. CTR


3. Anti-Fraud<br />

• 见 Lecture 3: Fraud Detection in Online<br />

Advertising<br />

• Anti-Fraud @ <strong>Sponsored</strong> <strong>Search</strong>


4. 系 统<br />

• 海 量 数 据 处 理<br />

– 上 PB 的 日 志 数 据<br />

– 千 万 级 的 Ads<br />

– 分 布 式 存 储 & 计 算 系 统 (Map/Reduce)<br />

– 并 行 计 算 (MPI)<br />

• 高 并 发 & 高 实 时 性<br />

– 大 流 量<br />

– 实 时 更 新 的 广 告 系 统


5. 应 用<br />

• 关 键 词 推 荐 工 具<br />

• 流 量 预 估<br />

• 账 户 优 化<br />

• etc.,


参 考 资 料<br />

• Jansen B J, Mullen T. <strong>Sponsored</strong> search: An<br />

overview of the concept, history, and technology[J].<br />

International Journal of Electronic Business, 2008,<br />

6(2): 114-131.<br />

• Li H, Xu J. Beyond bag-of-words: machine<br />

learning for query-document matching in web<br />

search[C]//Proceedings of the 35th international<br />

ACM SIGIR conference on Research and<br />

development in information retrieval. ACM, 2012:<br />

1177-1177.<br />

• Online Expansion of Rare Queries for <strong>Sponsored</strong><br />

<strong>Search</strong>: Broder et al, In Proc. of WWW 2009


Q&A?

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!