計算廣告學是一門由資訊科學、統計學、計算機科學以及微觀經濟學等學科交叉融合的新興分支學科。前MediaV首席科學家、前Yahoo!進階科學家劉鵬開設計算廣告學(Computational Advertising)公開課。課程位址:
http://study.163.com/course/introduction.htm?courseId=321007#/courseDetail
第二章:合約廣告系統
第一節:常用廣告系統開源工具
該課程的目标是把每一種産品形态的問題講述清楚,再介紹核心的算法和關鍵性的工具。
Hadoop:目前主流的大資料存儲和計算平台(Google有其自己的平台)。核心項目:HDFS;MapReduce。
兩種腳本語言:Pig(不需要對資料進行加工,更直接),Hive。
離線資料處理工具:
Hbase; BigTable(google),HYPERTABLE,Cassandra(facebook),這幾個是用于解決大資料上半結構化存儲的工具。
Oozie:
線上資料處理工具:
ZooKeeper(常用):分布式環境下解決一緻性問題的開源的解決方案。可以看做Chubby(Google)的簡化版本。
Avro(不常用)--Thrift(Facebook,用于取代Avro)
S4(Yahoo)--Storm(Twitter,流式計算平台)
Chuhwa--Scribe(facebook):分布式的日志收集工具;
Elephant-bird(Twitter):配合Pig使用
Thrift比較有用,推薦用它去關注邏輯層的東西
接口可以向下相容
第二節 合約廣告簡介
課程目标:知道合約廣告系統究竟在解決什麼問題?
傳統媒體購買方式:直接媒體購買(direct media buy),離線廣告的做法,線上廣告剛産生時也是這麼操作的。
Guaranteed Delivery,GD 擔保式投送:量在合約中會明确寫明,未完成則需賠償
量優先于質的銷售方式
Guaranteed Delivery付費方式多采用千次展示付費(Cost per Mille,CPM)方式結算,多以品牌廣告商為主
廣告投放機(Ad server):CPM要對不同的人群投送不同的廣告,是以要求投送由伺服器完成
點選率預測CTR,流量預測,閱聽人定向(人群劃分後才能去算)