天天看點

今日頭條,走好

"IT有得聊”是機械工業出版社旗下IT專業資訊和服務平台,緻力于幫助讀者在廣義的IT領域裡,掌握更專業、實用的知識與技能,快速提升職場競争力。

本文作者:L

今年春節可能是張一鳴過得最不開心的一年。

當各大網際網路公司豪擲千金在各大春晚上怒刷一波存在感時,本來也準備大幹一場的今日頭條旗下兩款産品——“火山小視訊”、“抖音”,卻遭遇了春晚冠名被多家衛視臨時撤下的尴尬窘境,最後不得不用剛剛收購的自拍相機App激萌救場。

至于冠名被撤的原因,據钛媒體報道,大機率上是因為李天佑,這個中國喊麥第一人因歌詞含有違法性質而被央視《焦點訪談》點名批評,随後遭到全網封殺。而火山小視訊正是李天佑直播的平台。

把時間往前推2個月。

2017年12月29日,因傳播色情低俗資訊,存在嚴重導向問題,對網上輿論生态造成惡劣影響。今日頭條手機用戶端“推薦”、“熱點”、“社會”、“圖檔”、“問答”、“财經”等6個頻道被暫停更新24小時。

短短兩個月時間内,這家被媒體捧為“TMD”三小巨頭之一的明星公司,旗下多款産品遭遇了不同程度的危機,而這很難說不是在為其信奉的“算法沒有價值觀”的“價值觀”買單。

衆所周知,今日頭條以新聞聚合閱讀起家,利用個性化推薦技術,打造出一款千人千面的資訊App,正是由于其對使用者資訊需求和閱讀喜好的準确把握,短短幾年時間内橫掃國内新聞閱讀市場,甚至開始威脅到百度在内容分發領域的地位。

然而即使今日頭條強大如斯,其頭上卻始終懸着一把達摩克斯之劍——版權與灰色内容,這也是算法短時間内難以克服的阿喀琉斯之踵。

算法的瓶頸

人工智能時代,算法确實代表着更為先進的生産力,但算法并不是萬能的。

去年9月,人民網曾連發3篇評論文章,批評以今日頭條為代表的,單純依靠算法推薦的平台價值觀缺失、制造資訊繭房以及走向媚俗化,并過度追求“眼球新聞”。

事實上這也是今日頭條目前所面臨的算法瓶頸。

作為對外界批評的回應,今日頭條在2018年1月對外公布了算法原理。

今日頭條,走好

圖檔來源于網絡

根據其公布的文章來看,今日頭條采用的典型推薦算法有協同過濾、邏輯回歸、DNN、因子分解機(Factorization Machine, FM)和梯度提升決策樹(GBDT)。

雖然目前業界普遍采用的是混合推薦來綜合各個推薦算法的優點,但算法的弱點仍然沒有被真正避免和彌補。

首先,算法嚴重依賴于資料的優劣。訓練資料的優劣則直接關系到算法模型的優劣。

算法背後實質上是機器所做的枯燥乏味的,冷冰冰的數學計算,計算結果基本上就是後續内容推薦的依據。

雖然點選率、閱讀時長、點贊、評論、轉發都是推薦模型裡可以量化的名額,但各大推薦平台卻不得不承認點選率在推薦模型裡仍然占有很高的權重。

利用人性弱點攫取使用者注意力的内容,在點選率這個名額上面的表現天然好于一般内容甚至是優質内容。

而使用者的點選閱讀行為資料反過來又會成為訓練模型的資料,成為給使用者推薦内容的依據,如此循環往複,最終畸形的資料造就畸形的模型,畸形的模型組合成畸形的系統,畸形的系統推薦出畸形的内容。

其次是資料有效性問題。

使用者的需求變幻莫測,但系統卻難以捕捉需求背後使用者的真實意圖,再加上閱讀場景的不同,使用者之間的個體差異,看似需求中暗含着某些規律,實際上可能是“技術的幻想”。

最後,目前世界上還沒有任何算法膽敢保證其推薦内容的品質。

媒體習慣于誇大其詞,比如過于強調人工智能的“智能”,而選擇性忽略人工智能技術實際的進展和應用情況。

事實上目前的個性化推薦系統還遠沒智能到讀懂文章的内容,更沒法從本質上分析内容有沒有價值,而隻能從外部的資料來衡量文章的品質。

從這個角度看算法确實沒有“價值觀”。

因為它還不知道價值為何物。如果沒有編輯幹預,個性化推薦系統會推薦什麼樣的内容難以想象。

而作為國内最大的個性化推薦平台之一,今日頭條顯然對這些問題有着深切的感觸。

了解人工智能的人都知道,數學裡的極限理論在人工智能領域有着廣泛的應用,雖然完全去捕捉使用者的需求和意圖不可能,但通過擷取更多元度的資料,交叉驗證資料的有效性或許可以去無限逼近使用者的真實需求和意圖。

與使用者行為資料和曆史閱讀資料相比,更有效的資料莫過于社交資料。

根據GWI2017年的報告顯示,平均每個網絡使用者每天在社交媒體和線上通訊平台上花費2個小時15分鐘時間,而這一數字在2016年還是1小時49分鐘。該報告還顯示98%的網絡使用者至少使用了一個社交網絡。平均每個網絡使用者擁有7.6個網絡賬戶。

今日頭條,走好

圖檔來源于網絡

無疑社交網絡成為了資料挖掘的富礦,也能很好的模拟現實社會。

但作為一款資訊産品,今日頭條的社交化之路并非坦途。

社交化苦旅

國内嘗試做社交産品的網際網路巨頭并不在少數,甚至說個個都有社交夢,大到阿裡、百度,小到網易,搜狐均在社交領域有過锲而不舍的嘗試,但鮮有成功的案例。

在QQ及微信的陰影之下,再加上微網誌、陌陌環伺,要從強敵面前趟出一條血路,難度着實不小。

但對于國内的頂級流量玩咖來說,今日頭條客戶的使用者及流量增長已經放緩,把海量的流量導出去,發力社交,提高使用者粘性,并利用社交資料反哺推薦系統,提高競争壁壘形成護城河是其不得不做的事。

于是也才有了今日頭條不惜和早期投資方新浪微網誌撕破臉也要做類微網誌産品的故事。

雖然新浪微網誌早在今日頭條2016年年末的融資中已經出售股份退出,不過随後的幾個月裡兩家公司還是相安無事。

直到去年9月,今日頭條為了推廣微頭條業務,允許使用者将微網誌上的内容同步到頭條,這引起了微網誌的強烈不滿,直接導緻微網誌關閉了微頭條産品的資料接口,并禁止微網誌内容自動同步到微頭條平台。

此後兩家公司你來我往交戰數回合,但微網誌顯然已無力阻止今日頭條一心要做社交的心。

正如諾貝爾經濟學獎獲得者詹姆斯·托賓所說:“不要把你所有的雞蛋都放在一個籃子裡,但也不要放在太多的籃子裡”。

張一鳴深谙此理,推出微頭條隻是今日頭條布局社交的一環,今日頭條還通過孵化,收購和投資等各種手段擁有了抖音、悟空問答、火山小視訊、musical.ly、Face U激萌、Live.me等多達6款社交或具有社交屬性的産品矩陣。

放眼整個中國網際網路,擁有如此之多社交産品的也僅此一家,怕是騰訊都自愧不如。

但如此激進的布局也折射出了今日頭條在社交化探索方面的焦慮。

能否将這麼多産品真正的整合起來形成合力尚且不論,單是每款産品的營運支出就是一筆巨大的開銷,至少就目前來看,這些産品都還處于燒錢階段,并未見有産品已經盈利的公開報道,此是其一。

其二,以上産品均屬于弱社交産品,使用者間的社交行為很難映射到現實社會。

不同于微信這樣的強社交産品,弱社交産品往往需要持續不斷的高品質UGC内容才能維持使用者的活躍度,需要一個活躍的,不斷有活水流入的社群才能保持較高的使用者留存率,這不僅需要強大的營運能力,更需要社群有自生産IP的能力,但就目前來看,道阻且長。

火山小視訊花重金從其他平台挖來的天佑還被封殺了,甚至還影響到了平台本身的推廣節奏。

其三,通過這幾年的野蠻擴張,今日頭條樹敵無數。

除了和新浪微網誌已經撕破臉,悟空問答挖角知乎的行為難免不讓周源耿耿于懷。而作為國内的社交巨頭騰訊是否會采取防禦措施也未可知。

最值得一提的是,今日頭條之是以能夠如此激進的布局社交,是在于今日頭條App強悍的吸金能力。

資料顯示,2016年,今日頭條靠資訊流廣告收入達60億元;2017年,增長至150億元;2018年的目标則是300億~500億元。

這也是為什麼今年1月底,百度和今日頭條有了一輪正面交鋒,百度顯然不願意看到自己的廣告市場被活生生的蠶食,“百頭大戰”恐怕在所難免。

當一艘航母孤零零的在海上航行,護航艦艇卻還在造船廠沒下水,一旦遇到強敵的猛攻,場面可以想象。

然而不幸的是,張一鳴的社交夢卻依托于今日頭條這艘“資訊航母”的平穩航行。

定時炸彈

六大頻道被暫停更新“24”小時,和百度爆發口水戰,兩款産品冠名被撤……這一連串的事件正将今日頭條一步步推向輿論風口。

如果說此前六年都是媒體在褒獎一個小巨頭的誕生,那麼2018年,或許今日頭條将面臨更多理性的審視。

當一家企業開始被推向輿論的暴風眼時,總有一些事不可控,比如現在的樂視。

除了前文已經詳述的算法問題,四面樹敵以及社交化的激進布局,埋在今日頭條成長路上的另一個定時炸彈則是版權問題。

可以說版權問題自今日頭條誕生起就如影随形。

隻要在搜尋引擎中鍵入“今日頭條侵權”關鍵詞,就能輕松找到多家媒體的最新報道。

今日頭條,走好

幾個有代表性例子,2017年5月,南方日報社釋出反侵權公告,稱2016年至今,“今日頭條”用戶端未經許可擅自轉載其版權作品近2000條。

在此之前的4月26日,騰訊和搜狐以涉嫌侵犯其所屬作品的資訊網絡傳播權為由,将今日頭條訴至海澱法院。

更早之前,包括新京報網、《廣州日報》、《長沙晚報》、《楚天都市報》等各類媒體都曾因版權侵權和今日頭條發生過版權糾紛。

而在短視訊領域,優米網創始人王利芬的一條怒批頭條侵權的微網誌則最具代表性,王利芬在微網誌指出,今日頭條旗下西瓜視訊毫無版權概念,取材隻依據使用者喜歡,找到内容第一時間推送并打上台标。

今日頭條,走好

 圖檔來源于網絡

此外,在今日頭條旗下的短視訊平台西瓜視訊上,存在着以影視劇片斷的形式批量傳播的大量短視訊,不過此類視訊因系使用者上傳,平台能借“避風港”規則作“擋箭牌”,然而侵權風險卻始終存在。

一旦今日頭條未來計劃登入資本市場,遲早要掃清版權障礙,規範化營運。

隻不過正如人民網在三評“算法推薦”的評論文章中所說的那樣:智能平台的身上也應流淌“道德的血液”,不能為隻為眼前的流量而放棄了長遠。

同樣借名為知乎作者王科的話:“推薦系統有其邊界,一切技術均有其邊界,局限于目前技術成熟度,局限于資料,局限于現實世界與技術世界的距離。”