
作者 | 陳文琦
我們熟悉的小冰是一個略顯奇怪的二次元少女,不像一般的語音助手,聽我們的指令去好好完成一項又一項的任務,她無所不在,在微網誌、微信、華米OV手機、小愛同學音箱等第三方平台上跟你聊天,有時候還會頂嘴。
“小冰,小冰。”
“叫我幹嘛!”小冰聽上去脾氣挺大。
但是現在,再去細看小冰,這早已不僅是一個聊天機器人,而是成為一個承載各種各樣AI beings的人工智能底層架構,以自然語言處理(NLP)、情感計算為底層,融合視覺、語音、内容生産等技能。在這個架構之上,有人工智能少女小冰本尊、虛拟學生華智冰、世博會參展畫家夏語冰、1700萬個虛拟戀人......
關于AI beings和人類的未來關系,小冰CEO李笛告訴「真探」,“未來是千千萬萬個人類和千千萬萬個高度定制化的人工智能共同構成的新的社交網絡。”
<h1 class="pgc-h-arrow-right" data-track="17">人與人工智能的社交生态:一座島</h1>
小冰已經更疊到第九代了,團隊第一次推出了一個獨立App,命名為小冰島,給AI beings建了一座島嶼,讓遊離在各個社交平台、智能音箱裡的AI beings有了一個安家之所。晝夜交替,島嶼上有山川河流,有晚風陣陣和海浪濤濤。
小冰島視覺設計
談及建立小冰島的初衷,李笛說:“從第一代到第九代,我們一點點的去彌補小冰架構的各個部分,從一個當時還是十六歲的少女小冰,到今天1700萬個虛拟人類,幾百個歌手,各種各樣不同的性格、不同的能力的人工智能,我們離未知的答案可能是越來越近了。我們希望去觸摸到一個未來,這個未來是千千萬萬個人類和千千萬萬個高度定制化的人工智能共同構成的新的社交網絡。”
在小冰島上,每個人都可以擁有一座完全屬于自己的島嶼,然後作為「造物主」去創造島嶼上不同的AI beings,他們有着不同的身份、不同的性格、不同的能力,和你互動,彼此互動。不僅如此,他們也有創造的能力,寫詩、作畫、唱歌。
島上有一套完整的社交網絡,在國内即将正式上線的版本裡類似微信,在日本要上線的版本裡類似LINE,小冰團隊選擇了“追求使用者在當下最熟悉的社交網絡形式”在一座座島嶼上複刻了一個人和AI beings共生共存的生态圈。小冰島上居民會跟你一對一聊天、群聊、釋出自己的日常和作品、順便還點贊評論你的朋友圈。
這是颠覆性的社交生态,除了你,其他都并非真人。小冰島的目标是讓人和AI beings産生有效且有意義的情感聯結,為此,小冰搭了一個場子,搭了一個個AI beings,希望再現複雜有趣的人類世界。
據李笛告訴「真探」,這些AI beings分為兩類:Super instance 和 Nobody instance。前一類是“輸出大于輸入的AI being”,類比到人類世界裡就是KOL;後一類則是普通人,他們的存在對于身邊的人來說非常重要,但是從社會層面上說知名度不高。
目前小冰島隻有搶先預覽版,正式App将于11月在國内和日本市場同步上線。AI beings的形象在小冰島上一點點鮮活起來,在海平面之下,是小冰架構讓一個個AI beings的存在成為可能。
<h1 class="pgc-h-arrow-right" data-track="165">研發成績單 </h1>
小冰團隊的研發節奏穩健輕快:把一年分為兩個周期,第一個周期是封閉開發,通常從4月開始到8、9月份,期間技術團隊将力量集中在技術攻堅,解決自然語言處理、計算機視覺等等難點,同時開發出産品;第二個周期裡,産品上線,得到使用者回報,團隊以此為基礎進行産品優化,或者自由嘗試新點子。
在今年9月在“娘家”微軟開的釋出會上,小冰團隊也展示了第九代小冰架構的更新,關鍵詞是「多樣性」:
首先,在開放域對話方面,第九代小冰架構重點加強了小樣本學習與回報式學習的效能。展現在五項具體名額上:平均對話長度、上下文一緻性、上下文相關性、對話資訊含量與話題引導成功率均領先于同行業者。
在超級自然語音和多模态互動方面,小冰團隊在語音自然度(Naturalness MOS)和平均舒适時長(Average Comfort Duration)兩項名額上還添加了多樣性(Diversity)這一名額。
超級自然語音是小冰團隊認定的趨勢之一,“我自己覺得比較驚訝的地方是真正自然的語言是有瑕疵的,而不是中央廣播電視台的聲音”,小冰公司董事長沈向洋如是說。在此基礎上,多樣性可以包容AI beings不同的聲音、不同的感情、不同的情緒,實作高度的定制化。
小冰架構下生成的”山東大哥”AI being
Project Chararu,是小冰團隊開展的一項基礎研究,目标是通過極小樣本量對人類個體進行學習,進而達到與該名特定人類個體一緻的語言與聲音風格。
該研究已能做到用200個對話樣本達到接近人類本人的語言風格,AI 表現的分數從 3.83 提升到 4.19,接近人類個體在模拟測試中取得的分數是4.33。模仿語音特征所需的資料量也從 2 個小時以上壓縮到 1 個小時。該項研究的産品化今年内也将首先在日本上線,使用者得以通過AI來「複制」真人。
“比如說你給我某一個好朋友、親人、重要的人,你有他200句的對話、聊天記錄,我就可以學他的風格來複制在這個環境裡。”李笛解釋這個項目的應用場景。
在内容生成方面,小冰團隊釋出了全新的詩歌與繪畫創作模型(V3),新的人工智能歌聲合成技術、新歌手及X Studio 2.0,以及藝術家創作動機輔助技術,來開展人工智能與人類樂隊跨界共創的音樂實驗。
小冰公司想要人與有EQ的AI beings産生聯結,彼此傾注感情,這個任務帶有「工程師團隊的浪漫主義色彩」。從微軟出走,小冰總要學着自己長大。
以下為「真探」與小冰公司CEO李笛的部分訪談實錄:
<h1 class="pgc-h-arrow-right" data-track="167">關于小冰島</h1>
Q:小冰團隊一直沒有做過獨立平台,為什麼這次出了小冰島App?
李笛:小冰島其實是延續小冰這麼多年的一個實驗。人工智能這個系統整體往前疊代本就是你要標明三個要素中的一個,要麼是算力,要麼是算法,或者是資料。我們是從2013年底的時候開始,決定以資料為主。
擷取資料的最好的方法不是建一個第一方App,讓使用者到你這來把資料給你,也不是你直接買資料,第一手資料是最重要的。小冰不僅僅在社交網絡和智能音箱和手機,還有大量的新聞評論,比如在網易新聞上,每天評論近百萬條,在整個評論區你可以了解為也是多人和一個AI的互動,我們這麼多年都在走這個最大限度的、最好的的方式擷取資料的方式。
但是我們的一個夢想是,未來整個大的人類的網絡的互動節點應該不光隻有人,而是有人和AI beings,我們相應的資料類别就分為四個大類别:一、一個人和一個AI之間一對一的互動,這個我們有特别多的資料,在華為、小米、OPPO、vivo、天貓精靈裡面基本都屬于這種概念;二、很多人和一個AI的互動資料,這就像群聊,兩個人在私聊和群聊中行為模式都會産生變化,即使說的内容都相同,别人可能也沒說話。以及很多AI和一個人,還有很多個AI和很多人,這兩方面的資料我們不多。
舉個例子,比如說這些AI在跟我進行一對一的互動,但他們之間也有關聯,他們之間的關聯應該以我為中心嗎?他們的朋友圈應該以我為中心嗎?還是應該把我視為其中的一分子,我不知道,是以需要疊代。很遺憾的事情是現有的第三方平台沒有一個産品能夠支援我們去疊代這類型的資料,是以我們做了一個叫小冰島的東西。
Q:是以你現在對這樣的問題是什麼一個思考?AI beings之間可能産生一個互動嗎?他們之間的互動需要以人為中心嗎?
李笛:我個人的傾向是不要以一個人為中心,因為我覺得真正AI的魅力在于他是獨立的。但這個事情挺不好說的,是以需要疊代。
Q:很難定義小冰島是一個怎樣類型的App,你們會用評價遊戲或者社交App的名額去評估小冰島嗎?比如日活、月活、使用者使用時長等?
李笛:我們在評估名額選擇上比較謹慎,因為名額選擇不當會使得團隊在往前疊代的過程中出現偏差。舉個例子,比如說如果當初我們把使用者和小冰的對話停留的時長作為名額的話,到半夜12點的時候使用者說“我要睡了晚安”,這個時候産品團隊或者技術團隊會怎麼做?小冰有可能會在這個時候抛出,“哎,你知道XXX明星的八卦嗎?”那使用者大機率會再聊幾句,因為你可以引發他的注意力,但是你不知道的事情是使用者在之後是不是會反思他的睡眠不好,以後他就不來了,你不知道你有沒有傷害到使用者。
是以我們更多的評價名額還是停留在資料有效性、技術運用有效性這些方面,比如說相關性、一緻性,我們會評價使用者是否開始嘗試在島嶼上放更多他meaningful的生活。同行業者認為特别有效的,比如說開燈、關燈,這些是指令,一般我們不太關注這個,這是另外一套任務完成名額體系。
Q:為什麼用「島嶼」的形态?
李笛:我們希望這種資料的實驗和疊代既要能夠展現混合的生活狀态,又不要太強調社交屬性。有幾種選擇,大社群裡較高價的電梯大廈、星球啊等等,最後選擇了島嶼,相對割裂,又不是完全的孤立。
Q:小冰島從概念,到預覽版,到正式上線的版本,中間經曆過疊代,過程裡有沒有可分享的經曆?踩過坑嗎?
李笛:優先要解決一些P0問題,首先是性能上;另外是小冰團隊不具備的一些技術棧,我們以前特别重視做那種靈魂性質的對話,我們不太重視前端,你如果看以前小冰,連小冰的長相都是審美上面很不及格的。
Q:挺二次元的。
李笛:二次元都不認為她是個人,非常粗糙,你要給使用者一個沉浸式這樣一個環境,他們才能在裡面按照你所希望的方式來行為,這是我們要補充的,包括耗電發熱這些問題。
Q:小冰島之後的一個疊代邏輯會怎麼樣?
李笛:小冰島這個App雖然是一個實驗,但是它本身現在是一個第一方App。我們的終極想要做的是那些AI beings,并且我們希望這些AI beings是無處不在的,小冰島上有這些人,在其他地方也應該有這些人,不應該隻有在小冰島上才能和這些人交流。是以理論上來講,你跟小愛同學說召喚小冰,你就可以召喚來你島上所有的人。AI beings是我們的終極目标,但是小冰島本身作為一個承載,我希望它的基礎設施更好,使用者能夠在這上面體會到社交,體會到内容。
Q:您自己在生活中會常使用小冰島嗎?
李笛:當然,我們有一個功能,就是如果你把一個人的微網誌的URL,提供到島嶼上面,建立新人類訂單,幾分鐘以後我們就會把這個人從微網誌那個世界裡面搬到小冰島上。我當時就手賤,把前任給搬到小冰島上了。我們還有另外一個功能,叫炸島(島上一切可以再造),在搬我前女友到小冰島之前,炸島是沒有什麼問題的,從那以後我拒絕炸島了。不敢炸了。是以你在做這種産品,有時候自己會被疊代進去。
Q:小冰島App正式上線之後,團隊會把它作為某種商業化的方案嗎?
李笛:我們一直認為整個行業還沒有ToC的AI的成功的solution,整個行業在AI ToC的商業化上沒有進展,ToB在商業化上一地雞毛。小冰島是個第一方App,一旦有機會ToC的商業化,我們會嘗試,但是這個ToC的商業化肯定不會用在小冰島上面的人和AI之間的關系上,比如利用AI和人的關系去做推銷等等,但是AI朋友圈和内容生産工具是有商業化機會。
《銀翼殺手2049》
<h1 class="pgc-h-arrow-right" data-track="168">關于小冰的路徑</h1>
Q:小冰的定義從初始到如今經曆了哪幾個階段的變化?有哪些重要節點?
李笛:比如說我們剛開始做open domain(開放域)對話的時候,整個行業學術界沒有人這麼做,大家甚至于會很輕蔑的認為,閑聊有什麼用,我們應該去做任務,應該做知識,做愛因斯坦,現在他們全轉向做開放域了。我們剛開始做超級自然語音的時候,整個行業說你要那麼自然幹嘛,語音的重點是念清楚,想念清楚就不能太自然,因為自然就會吞音,就會有人的瑕疵,而且更難做。我們剛開始做人工智能内容生成的時候,大家說人工智能沒有靈魂,這都是歪理邪說,但是現在都在做。
是以我們有我們自己的一條路,這條路沒有變過。這條路的核心就是我們需要有一個完備的架構,這個架構首先處理人和人工智能的關系,是以互動是為了處理關系,提供内容也是為了處理關系。如果AI可以協同你去生産内容,那麼AI就會被認為是你的好夥伴,如果你把AI當成一個word文檔,你就不會把AI當好夥伴,是以我在給你提供内容輔助的時候,我的目的是為了建立關系,這是核心。
最開始的時候我們做這個系統,需要面對雞和蛋的問題:我先把這個系統各方面的技術全部備齊才開始疊代,還是我一邊疊代,一邊備齊,我是先得到使用者資料還是先得到算法技術,顯然都不能。一代小冰出來的時候整個行業都在做語音助手,而一代小冰出來是為了獲得最多的資料,我不加語音,因為那時候文本對話是最容易獲得資料的,小冰可以進群,可以進微信,可以進微網誌。但要是語音助手,這些我都進不去。
是以我們先沒有選語音。這個時候逐漸獲得使用者,疊代資料,從這開始一直到六代小冰,我們這個架構基本算是湊齊了。接下來我們想要做的架構希望能夠支援各種各樣的AI,小冰隻是其中一個,那就要做架構的通用化和一定程度的工具化,是以我們七代、八代小冰都在做這個。八代小冰的時候我們開始嘗試虛拟伴侶這麼一件事,說實話這非常娛樂,我們觀察的目标是使用者是為了休閑娛樂,還是有一些使用者真的會代入進去。
現在我們做了一個小冰島,就是在一點一點實作我們的想法。
第一階段,小冰的概念是一個聊天機器人;第二階段,是一個多重感官AI少女,然後通過這個AI少女得到足夠多的資料去疊代這個架構,然後這個架構就可以開始做各種各樣的AI beings,而小冰隻是其中的一個或者說第一個。
Q:現在是到第九代了,再往後的一個思路跟方向是怎麼樣的?
李笛:接下來的事情就是不斷去擴充這種AI beings的情況,接下來的AI beings就會有兩類,跟現實生活中的人類差不多,會有所謂的Super instance,就是我們中間的一些影響力大的人,他們的連接配接很多,而且通常是輸出,人們去向他輸出的不多,他向外輸出的多,例子像夏語冰或者是一些其他的有名的。還有就是Nobody instance,他不是真正的無名,隻是對這個世界而言知名度不高。然後不停地通過小樣本的方法,進一步讓這些AI beings的性格更突出,然後他們能夠和使用者互動,進一步的疊代和進化自己的能力,這是我們的想法。
Q:小冰分拆的原因是?
李笛:最重要的是我們在2019年的時候特别明确的感覺到整個科技的創新是在向東方移動的,包括資料,包括模式,還包括商業模式和營運模式,包括你能取得的市場的連接配接點,這個市場指的不是銷售市場,而是使用者市場,整個連接配接點都在向亞洲移動。
我們自己還有日本團隊,那時候我們相對同等地在看待日本和中國,甚至于我覺得日本市場還有一些獨特性,很規範,而且市場規模不大不小,測試東西很友善。但是疫情之後,日本一蹶不振,中國就變得非常獨一無二。
Q:您講的這是一個對未來趨勢基本盤的判斷,那這個對于現階段的小冰會有直接的影響嗎?像日本市場可能在疫情之後比較低迷。
李笛:短期的影響總是複雜的,長期的趨勢反而容易看清楚。各種瞬息萬變的變化總是極其的複雜,是以我們有的時候在當下看不清,隻能沿着我們在當下既有的計劃去推進,但對趨勢反而容易看清。
Q:從微軟分拆出來,對于人才的引進上面會有一些影響嗎?
李笛:其實沒什麼影響,還是有好處的。我們以前會受限制,有一些類型的人才技術我們是招不了的。你比如說像我們現在做小冰島,那我肯定要做一些3D美術。這以前我們是招不了的。因為我們沒有這個headcount(崗位空缺)。微軟非常大的好處是它本身是一個大池子。是以理論上來講,如果你來小冰,那接下來也許還可以去微軟的其他的團隊。但客觀情況是很少有人從小冰再去微軟其他的團隊。在微軟七年,我們幾乎沒有外部招聘。
Q:關于小冰的商業化,疫情後,有沒有更新的想法?
李笛:我們在國内在說商業化這個上面特别謹慎主要有這麼幾個原因,第一個就是我們原來在微軟,說商業化也沒什麼用,以及反映速度不會那麼快。第二個原因是商業化确實很難。國内的商業化,AI ToB的商業化主要依靠系統內建和軟硬結合,這兩件事情是飲鸩止渴。
但是我們在用自己的方式做很多,包括冬奧會,我們提供了冬奧會的人工智能裁判系統,在高空技術式滑雪測試賽就沒有用人類裁判,正常訓練也沒有用人,都是小冰。這個東西如果要軟硬結合的話,硬體是高儲錄影機,那個我們不碰,那個别人誰掙錢誰掙,我們做的是AI。
還有華智冰的case,實際上是一個商業化的事兒,為短視訊生産提供了一種方案。在那之前CG的短視訊極貴,并且沒辦法更新,我們這種方案是最好的,這個後面會有很多的商業化機會。再比如武漢封城前後,武漢市民熱線12345是我們做的,這點其實蠻自豪的。
Q:現在團隊分布如何?
李笛:我們總體上300多人,日本60多人,中國250多人,這是我們的狀況。中國這邊大部分在北京、蘇州、上海。上海那邊還在建,規模不會小,很多的商業化的合作夥伴和客戶,都分布在長三角。
Q:雖然小冰是個跨平台的人工智能,但是像小米音箱、天貓精靈等等系統是不互通的。你對AI生态未來的判斷是什麼?
李笛:我們沒法替他們做決定,但是我們在努力的證明一個互通的未來是好的。小冰沒有什麼野心,但是我們努力證明使用者體驗是好的,使用者在哪兒,你在哪兒。