天天看點

做榜單卻拒絕收費,他們的「人工智能大資料服務」是如何落地的?

在雷鋒網拜訪絡策網絡科技之前,對方給發了一份關于公司和産品的簡介資料,内容非常簡潔,都是一些落地到實處的技術用法,如果沒人講解,你很難認為這是一家人工智能公司。這種邏輯簡單明了的“技術宅”風格倒是與其創始人jeff

lin的氣質十分契合,jeff

lin是美籍華人,說話短、平、快,直來直去,不繞彎子,在介紹其産品時沒有像很多創業者一樣,一直在說自己的技術有多麼多麼牛,而是不斷地在介紹自己技術的應用場景和用途。

jeff說,過去20年他一直都在做科技公司,地圖、圖檔分享等領域都有涉獵,最近的一次創業是一個比較有名的圖檔分享軟體“圖釘”。大概從2014、2015年左右開始,jeff就接觸到了人工智能這一塊,并且認識了絡策公司現任首席科學家的carl

kovamees。carl當時就在做神經網絡相關的項目,是其前公司的聯合創始人之一,後來其公司被收購,恰逢人工智能風潮襲來,jeff就和karl一拍即合,成立了絡策。

做榜單卻拒絕收費,他們的「人工智能大資料服務」是如何落地的?

一、老百姓也能用的大資料産品

剛開始看絡策産品資料的時候,雷鋒網的第一個直覺感受,就是他們做了一個排行榜類的公衆号——insight排行榜,在内容創業如此泛濫的今天,這不免讓人感覺有些缺乏新意。當跟jeff聊了之後才知道,這隻是他們把人工智能落為實際用途的一個産品而已。

“老百姓可能都聽說過大資料,一提起大資料,就覺得很高科技,很厲害,但是多數人都不明白大資料具體是幹嘛的,我們這個insight排行榜就是用神經網絡收集了大資料,然後用最直覺的表現方式給老百姓使用”。

jeff介紹,insight排行榜是一個消費品品牌排行榜,在這個公号内不定期的會釋出不同領域品牌的排名,但是與很多網絡上排行榜不一樣的是,這份榜單并非人工撰寫,而是依賴大資料分析自動生成排名,再由人工放到公号上去。

簡單來說,公司的大資料系統接入了很多電商評論系統、社交網絡工具(微網誌、facebook、twitter等等)以及論壇等等,爬取上面關于商品的評論文字,通過nlp分析處理,得到這些産品在網絡上的“使用回報”,而這些“使用回報”則成為這個榜單最主要的排名依據。

“這份榜單是我們認為最公正、客觀的,因為我們是拒絕與品牌商合作的”。

上面jeff所說的拒絕與品牌商合作的意思是不給予他們競價排名的機會,進而保證榜單的公正性。而在客觀方面,由于排名受網絡評論影響,難免會遇到一些“水軍”或者惡意刷評,是以在這方面,insight排行榜在進行資料分析的時候,做了一個排重機制,把一些重複的評論抵消掉,讓其盡量拿到真實使用者的回報。

絡策在用大資料處理榜單方面嘗試了三個月,在完全沒有推廣的情況下,做到了微網誌4w+粉絲,微信公衆号由于需要長期積累,目前還沒開始發力。

做榜單卻拒絕收費,他們的「人工智能大資料服務」是如何落地的?

做2c産品對于做技術的人來說,通常都很難,因為消費者和企業在技術方面的需求不一樣,技術公司想在2c方面找到好的商業模式還是有些困難的。

上面說的insight排行榜隻是絡策在人工智能落地方面的一個實際性的嘗試,雖然其面向消費者完全免費,又不和品牌商合作,看似完全公益化,但是其中卻有個商業邏輯在裡面。

雖說insight排行榜為了公正不與品牌商搞競價排名,但并不是完全拒絕品牌商方面的合作進而産生收入。如此說來看似沖突,但是這個商業邏輯卻很讨巧。

當insight排行榜一個品類的榜單出爐之後,他們也會找這些上榜的或一些沒有上榜的品牌商進行商談,商談的内容并不是關乎排名本身,而是關乎企業為何處在排名中的位置。

舉個例子,在榜單中做一個奶粉排名,榜單出爐之後,可能第一名、第二名對自身認知很明确,覺得排名沒有異議,就不會予以理會。但是對于排名在中間或後幾名的廠商,會想知道自己為什麼會處于現在的位置,為什麼排名不會更靠前,這個時候,絡策的商業邏輯就顯現出來了。

絡策方面會向這些品牌商提供榜單排名時的資料,以及經過分析處理的網絡評論與回報資訊,讓廠商意識到自己的問題在哪,比如,有很多使用者回報“奶粉太甜了”之類,這樣能夠讓廠商針對這個問題進行整改。而提供這些資料與回報,品牌商是需要向絡策付費的。

以上所說,就是絡策的大資料分析服務其中之一。在其目前主營業務之中,

insight大資料分析平台是其産品重要布局之一。

 insight大資料分析平台是一個saas服務平台,用jeff的話來說,幾乎不需要教育訓練成本,讓非技術人員隻登陸網址就能進行專業的資料分析,而絡策方面則對使用者的分析結果進行收費。

據介紹,這個分析平台可以幫助品牌商抓取24小時内的社交網絡内容,讓品牌商及時了解該品牌在過去24小時的網絡評論,除了能夠收集各種關于品牌的相關資料,更能幫助品牌監測輿情,如果系統的語言處理機制發現大規模的負面評論,品牌商就能夠立即悉知該消息,并且通過平台直接連接配接社交網絡(微網誌)對使用者進行相關解釋。

圖檔

利用自然語言處理做大資料分析的技術提供商還是有很多的,但是這些廠商在向品牌商提供網絡資料的時候,對于圖檔内容是很難搞定的。

“圖檔資料也十分重要,有的時候一張圖檔裡面有字,很多資料系統能夠抓取,但更多的時候隻是一張圖,你要分析裡面有什麼就必須需要神經網絡的支援。”

jeff告訴雷鋒網(公衆号:雷鋒網),為了搞圖檔分析,絡策做了七個獨立的神經網絡,包括半督導的訓練叢集和由gpu伺服器組成的生産叢集環境,支援不同品牌的logo識别、成人内容識别、1,000+通用物件識别(日常用品、汽車等等)、360+環境背景識别、人臉識别(性别、年齡段以及表情的識别)等等。

做榜單卻拒絕收費,他們的「人工智能大資料服務」是如何落地的?

關于先做7個神經網絡,jeff表示,這是基于他們首席科學家以往的經驗,先搭了7個神經網絡的架構,而這些架構有内在邏輯在裡面,并不是随意搭的。舉個簡單的例子,比如一個品牌商在收集資料的時候,肯定想要知道“我們産品出現的同時有沒有其他品牌出現“(logo識别)、”使用者在用我産品的時候跟環境背景有什麼關聯”(通用物體、背景識别)、“什麼年齡段的人在用我們的産品”(人臉識别)等等。

目前,絡策針對這些神經網絡在進行調試,不停地給他們進行訓練,準确度已經達到了人們能接受的容錯範圍。

jeff直言,在圖檔識别這一塊,識别率不會達到百分之百,就算人眼因為折光等問題都可能産生誤差,是以神經網絡隻能在不停的訓練之下讓其準确度更高,達到商業資料分析用途的标準就可以。

視訊

在視訊分析服務方面,jeff給雷鋒網示範了一個系統對可口可樂的廣告視訊分析的demo,視訊播放過後,系統直接就能給出資料:

可口可樂短視訊總長16秒 監測出可口可樂的logo出現了3次,時長11秒,分别為2秒-6秒,9秒-11秒 14秒-16秒之間 •  同時監測出logo出現時的背景場景,通用物件和人物資訊
做榜單卻拒絕收費,他們的「人工智能大資料服務」是如何落地的?

這個視訊分析功能将被用在品牌商對視訊品牌露出的檢測等方面,比如品牌商在電影中投放廣告,想知道自己的植入到底出現了多少,這個時候,該系統就能發揮作用了。然而這種視訊可視化的搜尋系統目前卻少有人在做。

“視訊分析現在很少有人做,主要原因是架構搭不好。”

jeff說,視訊分析主要核心點在于架構,直接影響視訊的拆幀。比如,一個20幀的視訊,一秒鐘能夠拆成20張圖檔,如果系統架構做不好,速度不夠快,在一秒鐘内不能分析完這20張,接下來的時間就會有新的圖檔進入,系統就會堵塞

。而他們的視訊分析架構經過優化之後,能夠達到非常流暢的分析效果,甚至用在直播的畫面上也是可以的。

目前人工智能概念炒得火熱,多數産品都處于概念之中,對于人工智能如何落地等商業模式方面的探索顯得有些匮乏。

“作為一個創始人,應該明确的知道要做什麼”。

有着20年科技行業從業經驗的jeff,對市場的觀察還是十分敏銳的,無論是大資料榜單、大資料服務亦或後來的圖檔視訊分析,這些産品都能夠很好的落地到實際用途中,把目前火熱的“神經網絡”、“nlp”、“人工智能”等等熱詞融入到了産品中,想清楚了商業模式并加以實施。

去年12月份,絡策網絡科技拿到了由飛拓無限、德同資本的投資,飛拓無限是國内一家提供移動網際網路整合營銷服務的移動網際網路公司,去年年底剛在新三闆挂牌上市,也就是說,此次融資除了讓絡策有更多的資金投入技術研發之外,還在資源整合上增益了不少,加快了一些其“人工智能”技術在跨社交媒體的大資料服務的落地。

總之,把技術快速用在實際用途中,是絡策目前的風格,也是目前所有創業者最應該優先考慮的事情。

本文作者:趙青晖

繼續閱讀