天天看點

楊植麟:選擇創業,是為了從“組織架構”上解決AI落地難題

在剛剛過去的2021年裡,中國人工智能界最受人矚目的一件事,莫過于被譽為「AI四小龍」之首的商湯科技在香港聯交所成功上市,成為「中國AI第一股」!

對于許多正在奔跑的「AI科創家」來說,這無疑是一個振奮人心的消息——它讓人們看到,AI創業并非登不上台面的兒嬉戲語,也全非「寒冬」一說。早年間創立的「AI四小龍」,在摸爬滾打中嘗到的,也不僅是開辟AI産業化的苦果,還有AI落地先鋒的甜頭。

2018年「深度學習三巨頭」Yoshua Bengio、Yann LeCun與Geoffrey Hinton獲得圖靈獎後,人們普遍認為,未來十年,人工智能領域不會再出現重大的理論突破;相反,人工智能的發展将越來越多地展現在AI技術的應用及其與産業的結合上。

換言之,「AI 能賺多少錢」成為了新的關注點。而随之出現的,是越來越多的AI創業公司。

與老一輩以「AI四小龍」為代表的80後創業者相比,新一代的90後青年科學家在AI創業上有些許不同之處。

比方說,投資環境。老一代頻頻趕上AI投資熱潮,而随着深度學習的瓶頸突現、AI技術成果轉化難等等問題的出現,新一代創業者在找錢的問題上越來越多地遇到投資者的質疑與防備,同時也面臨越來越多的競争對手。

技術發展上,原先AI的落地集中在感覺智能上,後來AI兼并了更多領域的知識(圖形學、統計學、強化學習、演化計算等等),新一代科學家的創業方向也開始更加多元化。除了計算機視覺,還有語音識别、自然語言了解、圖形學、晶片……

為此,我們策劃了「AI科創家」系列,邀請年輕一代的AI創業者與我們分享他們的創業故事。第一位創業者,是一位在學術界與工業界均十分有名的90後青年學者,他就是循環智能(Recurrent AI)的聯合創始人、Transformer-XL與XLNet一作楊植麟。

1、「激進」的AI落地法

「我想有一條更激進、更徹底的路徑去打破學術界與工業界的壁壘。」被問及創業的原因時,楊植麟這樣答道。

在投資人的眼裡,楊植麟與循環智能的其他創始人一樣,有一份絕對拿得出手的光鮮履曆:

大學就讀于卧虎藏龍的清華大學計算機系,師從IEEE Fellow唐傑,2015年以年級第一名的優異成績畢業;

随後,赴自然語言處理(NLP)研究全球排名第一的卡内基梅隆大學語言技術研究所(LTI)攻讀博士,師從知名學者Ruslan Salakhutdinov與William Cohen;

博士期間,他與圖靈獎得主Yoshua Bengio合作釋出「火鍋問答」資料集HotpotQA,又以一作身份發表的 XLNet 與 Transformer-XL在NLP領域産生重要影響,成為 NeurIPS 2019 與 ACL 2019 的最高引論文之一,谷歌學術引用次數直接破萬……

楊植麟:選擇創業,是為了從“組織架構”上解決AI落地難題

圖注:楊植麟的谷歌學術論文被引首頁

一般來說,卡内基梅隆大學計算機專業的博士生往往要經過六年的學習才能畢業,而楊植麟隻用了四年(2015-2019)就從CMU出師,一度成為學術圈的風雲人物。

作為一名佼佼的青年AI學者,楊植麟确定自己志在推動人工智能技術在現實生活中的大規模應用。

一般來說,年輕博士生參與技術落地的途徑是進入資金雄厚、牛人雲集的大廠,在其中謀得一官半職,比如他的兩位博士導師Ruslan Salakhutdinov與William Cohen并分别在搞學術之餘擔任蘋果 AI 研究負責人與谷歌首席科學家。

但楊植麟認為,「科學家加盟大廠」的模式在組織架構上存在局限性,并不能令他更深入地參與到AI落地中,也無法從根本上解決工業界進行AI落地的瓶頸:

「我覺得AI行業面臨的共同問題是學術界與工業界之間的Gap。我們看到老師們在工業界有一些title,但其實本質上他們還是在做研究工作。基礎研究固然重要,但無法打破這種壁壘,研究内容與實際落地之間還有很多步驟。」

具體的表現有:一,高校教師往往更偏向學術研究,與工業界的聯系較少,也缺少工業界落地的思考與驅動力;二,與此同時,雖然許多網際網路大廠也會招入傑出的科學家去解決技術難題,但它們的首要出發點是賦能業務,而非推動AI落地。

從大廠運作的組織架構上來說,這些傑出的科學家沒有足夠的資源或權利去推動産品落地。公司的業務方向會調整,即使科學家有意願去推動一項産品的落地,成本與代價也會大幅增加,技術的轉化率與效率也會受到企業組織架構的影響。

在楊植麟看來,這是一個非常大的限制,這也造成了在大廠中,許多AI技術的落地周期十分漫長,也不夠靈活。是以,2019年博士畢業時,他拒絕了谷歌、Facebook與華為等大廠的高薪offer,選擇了回國創業。

楊植麟:選擇創業,是為了從“組織架構”上解決AI落地難題

圖注:楊植麟與兩位博士導師Ruslan Salakhutdinov(最右)、William Cohen(最左)合影「創業的好處是我們可以自己決定公司的組織架構。人生苦短,精力有限,優化公司的組織形式可以有效減少中間損耗,縮小技術轉化與社會價值之間的距離。」楊植麟談道。

楊植麟對AI科技評論回憶,他的大學與博士導師都十分看重技術的實際價值,這給他帶來了很大的啟發。不同的是,他會更激進地去追求落地的結果,深入業務中進行研究。他的計劃是同時進行學術研究與技術落地,并同時取得成果。

循環智能成立于2016年。也就是說,楊植麟從博士二年級開始就一邊搞學術研究、一邊創業。

正是有感于「大廠科學家」的尴尬處境,他一直強調「我們需要新的思考」。在循環智能,他不僅是AI技術負責人,還是産品經理,這無疑是一個「範式層面的革新」,是他心中能夠有效打破技術與價值之間壁壘的最優途徑:

「一方面,我們會去做基礎的研究,如預訓練、多模态等;另一方面,我們也要去進行落地。這兩個事情可以互相提升與促進。」

2、研究與落地,雙輪驅動

循環智能最早的三位創始人陳麒聰、楊植麟與張宇韬相識于清華大學的知識工程實驗室,都有一股「用AI創造社會價值」的熱血。三人都是技術出身,後來因為業務發展,循環智能在2018年又引入了另一位擅長技術産品營運的「第四把手」揭發。

自成立以來,楊植麟就是團隊的核心技術骨幹。2016年與2017年,他與陳麒聰、張宇韬開始摸索技術的應用方向。

對新一代AI創業者來說,2017年是一個重要的時間節點。

那一年,谷歌團隊在“Attention is All You Need”一文中提出Transformer模型,該模型沒有采用卷機網絡與以往RNN的時序結構,采用編碼機制,編碼端同時包含語義資訊(Multi-Head Attention)和位置資訊(Positional Encoding),能夠并行計算,大大提升了語言模型的訓練速度。

對于專注技術落地的創業者來說,這無疑是一項利好消息,能夠減少預訓練的時間,節約研發成本,加速技術與場景的比對速度。Transformer的出現,打破了計算機視覺憑借深度學習在AI創業圈一統天下的壟斷局面,使一大批基于NLP技術的創業公司開始嶄露頭角,循環智能便是其中之一。

循環智能的主要業務是運用NLP、語音、多模态、大模型等人工智能技術打造「銷售科技」方案,幫助企業的銷售團隊提升銷售業績。

楊植麟談道:「我們認為,AI産生價值的過程可以分為幾個階段,而其中一個階段就是幫助每個人變得更好,提升人的能力,進而提升整個社會的運作效率。這個Vision(願景)是我們公司成立之初就有的想法。」

據他介紹,循環智能選擇将AI用于「提升人的溝通能力」,也是經過了很長時間的探索,與客戶交流、不斷疊代才确定。最終,他們抉擇的原動力是客戶的訴求,以及對整體市場的判斷。比如,根據CB Insights的資料統計,2016年銷售科技初創企業的投資額就超過了50億美元,此後逐漸遞增。這也表明了市場對這個賽道的信心。

楊植麟:選擇創業,是為了從“組織架構”上解決AI落地難題

圖注:Gartner的銷售科技(SalesTech)技術成熟度曲線2021顯示,銷售賦能一支已經渡過「技術萌芽期」(Innovation Trigger),進入「期望膨脹區」(Peak of Inflated Expectations)

如前所述,楊植麟認為,AI系統的組織架構會影響産品的能力,而組織架構的靈活設定可以幫助他們以一個更好的模式去推進産品落地。在創業的過程中,楊植麟實作了學術研究與工業落地的雙輪驅動模式。比方說,他被 ACL 2019 接收 Transformer-XL 一文,早在發表之前就已應用在了循環智能的 ASR 産品中。

對于這項基礎技術的快速轉化,楊植麟引以為豪:

「在預訓練的過程中,我們将技術部署在産品系統上,讓它能以實際資料集的運作效果為最終目标,驅動中間的研發過程。在将挖掘系統落地時,系統也是以最終的業務結果為目标進行學習與優化。同時,中間過程又可以疊代出很多AI問題與基礎技術,使得之後的産品可以進一步改善。」

AI模型的落地中,一個常見的問題是資料集的真實性與完備性。

一般來說,研究者在改進模型時,往往是基于特定的、人工創造的資料,但這些資料也許并無法完整、正确地描述模型在實際場景中遇到的情況。是以,盡管預訓練的若幹技術都已在學術界的許多資料集上得到了測試,且性能優異,但在實際應用中,卻仍需要非常多的技術改進才能部署落地,因為模型會遇到更多更複雜的問題。

目前,在解決這一問題上,學術界仍未有突出進展。但在創業的過程中,由于楊植麟與團隊的預訓練技術研究從一開始就是在實際的資料集中測試,直接與AI産品架構比對,是以,類似的落地問題便能從根拔起。

3、談談「NLP+銷售」

除了2017年的Transformer,近年來,人工智能領域又湧現出了許多基于Transformer的大規模預訓練語言模型,比如Bert與GPT-3。此外,還有許多新興技術對AI創業者産生了積極影響,比如少樣本與零樣本的研究突破。

從NLP技術落地的角度來看,這将是一個個革命性時刻。因為通過将這些研究成果有機結合,AI模型的效果與效率能夠得到大幅提升。在某些場景中,研究者甚至隻需要通過非常少的樣本、甚至零樣本就可以取得跟以往一樣好的效果。

對于循環智能來說,這意味着,在用AI提升銷售轉化率的過程中,他們能夠做到很多以前做不了的事情,比如會話洞察與分析引擎。随着NLP落地技術的逐漸成熟,加之企業服務在全球範圍内成為新的投資熱點,楊植麟與團隊憧憬,通過「NLP+銷售」的路徑,循環智能也有成為「中國Gong.io」的可能。

具體來說,用人工智能提升銷售效率的過程可以分為三步:一是對銷售與客戶之間的會話資料進行采集;二,對有價值的會話内容進行挖掘并模組化,将非結構化資料轉為結構化資料;三,分析會話資料,找出銷售人員在與客戶溝通的過程中存在的問題,更精确地分析客戶意願,并給出解決問題的關鍵要素。

歸根到底,就是對大規模的文本資料進行高效分析。

聽來簡單,但事實上,「AI+銷售」是一條同時具備市場剛需與高技術壁壘特征的賽道,因為這要求AI系統具備綜合分析的能力, 除了算法,會話洞察能力、資料分析能力、行業營銷知識等等也缺一不可。這很符合循環智能創始團隊的創業風格:既要創造價值,也要擁有一定的技術門檻,提高競争難度,減少對手。

從剛需的角度來看,業績增長是每一家企業的發展根基。銷售作為市場營銷中的一環,其會話流量的轉化率對業務目标的影響至關重要。據楊植麟觀察,流量轉化率在許多行業中都是一個突出的痛點問題,尤其是金融行業。

他們曾接觸過一個國内的頭部保險公司X,旗下有一家分公司Y。Y的銷售困境是:雖然Z的銷售團隊賣出了許多保單,數量遠遠高于X位于鄰城的另一個分公司Z,但所收的保費總和卻比Z要低。經過分析,原因很簡單:因為Y的均件保費遠遠低于Z。

這時,他們需要通過分析手中已有的資料,來找到拯救萎靡業績的方案。而回顧已有資料,企業的唯一法寶,是儲存了大量的溝通語音或文本資料。

對于計算機來說,未經解碼的語音資料猶如黑盒,同時是非結構化的。這時,NLP與語音技術的結合可以對這些非結構化資料進行高效解析,并管理一個企業銷售團隊的溝通過程。換言之,此時AI産品還是一個「管理抓手」的角色,分析銷售人員與客戶的溝通情況,洞察客戶需求,提高銷售管理能力和銷售團隊的工作效率。

「我們提供的産品可以把每位銷售人員在每一天的開口率以非常清晰的、精确的方式呈現出來。它能定位到每一個團隊成員的每一通電話、每一次溝通,據此便可以做很多報表分析,進而知道每個團隊的問題在于何處。」楊植麟介紹。

楊植麟:選擇創業,是為了從“組織架構”上解決AI落地難題

圖注:循環智能AI産品的原理示意圖

根據實戰的結果,循環智能打造的AI系統每天可以處理超過 1 億次的對話數量,幫助Y将保單的均件保費提升了大約20%。目前,他們已與數十家銷售人員超過一千人的企業合作,主要覆寫銀行、保險、房地産、汽車等四大行業。

楊植麟解釋:「這幾個行業都有一個共同的特點,就是對銷售技能的要求高,銷售過程非常複雜。同時,相對來說,這些行業有精細化營運的需求,它們的精細化程度達到了一定的門檻值,足以支撐他們應用AI系統來優化效率。」雷峰網

在這個過程中,他們的AI系統背景也積累了數千個來自不同行業的語義模型,構成了循環智能AI大腦的強大知識庫,有利于NLP模型的進一步落地。去年,他們與華為雲合作,開發了大規模中文模型「盤古」,在部分實際場景中達到了優于Bert與GPT系列的效果。

目前,循環智能已進行到B輪融資,連續三年實作了超200%的營收增長。不過,楊植麟談道,創業必須深入業務:「我們現在還屬于将産品打磨成熟的階段,主要任務是擴充與提升銷售溝通場景的覆寫面。」

4、創業感想

楊植麟認為,決定一家技術創業公司是否能立足的兩個因素,一是具備多元度的綜合能力,二是深耕行業,能夠将通用産品與細分的行業方案進行有機結合:

「當我們擁有了一個通用的技術品牌後,我們可以用較低的邊際成本将其擴充到新的行業、新的公司與新的細分場景中。是以,我們需要一個成為『行業專家』的團隊,能夠提供專業的行業方案,再用這個專業方案包裝産品,進行落地。」雷峰網

循環智能擁有明星創始人團隊,在吸引綜合人才方面并不難。楊植麟也強調,打造用于提升銷售的AI系統并不能僅靠一群「NLPer」或「CSer」的力量,還需要有硬體人才、營銷人才、行業分析師等等。

在科技賦能數字經濟的程序中,NLP的核心價值往往展現在最後一公裡。對于任何行業來說,隻要有溝通資料與文本資料的場景,NLP技術就可以發揮價值。傳統的NLP場景最大的瓶頸是規模化,但随着Transformer、少樣本/零樣本學習等研究的突破釋放了極高的邊際價值,楊植麟相信,在未來幾年,NLP的規模化賦能将成為可能。

創業五年,楊植麟總結了自己在技術以外的成長:一是有機會學習到商業邏輯,加深了對行業與場景的認知;二是學習到如何建立與營運一家公司;三則是能有一種更徹底的方式縮短了技術與價值之間的鴻溝。

十年前,也許很多人會認為,進入大廠才是研究實用AI的最佳途徑。但随着近一兩年來越來越多的技術大牛從網際網路大廠離職,或回歸學術界,或自主創業,人們開始意識到:要推動人工智能技術的大規模落地,需要一種新的運作模式。從這點來看,楊植麟的選擇頗有先見之明。

據了解,目前,楊植麟除了在循環智能創業,同時也在清華大學、智源研究院等機構主導了多個AI研究項目,繼續踐行他對如何打破研究與應用之間壁壘的思考。在創業與學術的雙輪驅動下,楊植麟等新一代實幹家,給中國人工智能的未來帶來的不僅是「激進」的應用,還有培養從研究端就開始思考技術轉化的青年人才。

薪火相傳,未來可期。

參考連結:

1. https://www.gartner.com/en/documents/4004056/hype-cycle-for-crm-sales-technology-2021

繼續閱讀