天天看點

當AI學會了聞味兒,人類就可以少工作70年

當AI學會了聞味兒,人類就可以少工作70年

當AI學會了聞味兒,人類就可以少工作70年

作者|李禾子

不知道有多少人還記得Google Nose。

這個谷歌在2013年愚人節上線的搞怪項目聲稱有一個包含1500萬種味道的氣味資料庫,使用者隻需要在谷歌搜尋框輸入關鍵詞,點選“聞一聞”,就能直接在電腦旁聞到該物體的味道,比如新車的味道,篝火的味道,以及埃及古墓的味道(?)等等。

就是這個十年前離譜但腦洞大開的玩笑,正在被它的發明者部分變成現實。

今年9月初的《科學》雜志刊登了一篇由初創公司Osmo(從谷歌分拆)和莫奈爾化學感官中心(Monell Chemical Senses Center)等多個研究團隊共同釋出的論文,其中稱,AI模型可以讓機器擁有比人類更好的“嗅覺”。

當AI學會了聞味兒,人類就可以少工作70年

乍一聽這簡直太不可思議了,畢竟對大衆來說,嗅覺是比視覺和聽覺抽象得多的存在。RGB顔色圖譜可以描述人眼看到的色彩,人耳聽到的聲音也可以轉化為不同頻率的波長,甚至讓人感受到震動,但唯獨嗅覺,看不見摸不着,更難以用量化的名額描述。

換句話說,把氣味數字化聽起來就是件不可能的事。

而這篇論文的研究人員核心要做的,正是去試圖建立一個能夠如實反映氣味特征的人類嗅覺高維圖譜,即POM(Principle Odor Map)。

那麼具體是怎麼做的呢?

我們知道,氣味是人類嗅覺系統對散布于空氣中的某些特定分子的感應。氣味分子進入鼻孔後,會與鼻腔上方的嗅覺細胞産生(受體)反應,産生的生物電波再通過神經傳到大腦,繼而識别味道。

而氣味的構成實際要比色彩、聲音複雜得多,有數以百萬計的不同種類,每種氣味又都由數百個化學分子組成,其性質各不相同。與之相應地,人類的功能性嗅覺受體有大約400個,遠遠超過了我們用于視覺的4個,以及用于味覺的約40個。

是以面對如此複雜的嗅覺機制,研究人員首先做的事情就是建立了一個機器學習模型——消息傳遞神經網絡(MPNN)。

模型示意圖

這是一種特定的圖神經網絡(GNN),因為圖神經網絡是一種基于圖結構的深度學習方法,将傳統的圖分析引入,提供了對非規則資料提取特征的方法,因而也非常适合用來學習複雜的氣味特征。

模型搭好之後,接下來就要喂給它學習材料。

研究人員結合了Good Scents and Leffingwell & Associates(GS-LF)香精香料資料庫,建立了一個包含約5000個分子的參考資料集作為訓練基礎素材,每個分子可以有多個氣味标簽,比如果味、花香、芝士味和薄荷味等等。

當AI學會了聞味兒,人類就可以少工作70年

GS-LF資料庫中的部分分子

通過将分子的形狀結構作為資料輸入,模型得以輸出最能描述某種氣味的對應氣味詞。

為了使訓練結果更準确,研究者同樣用到了各種方法來優化模型參數。比如将GS-LF香精香料資料庫按照8:2的比例劃分為訓練集和測試集,訓練集被進一步劃分為五個交叉驗證的子集;以及使用貝葉斯優化算法對資料進行交叉驗證,并對GNN模型的超參數進行優化等。

實驗最終将形成如下的嗅覺高維圖譜POM(局部):

當AI學會了聞味兒,人類就可以少工作70年

這張圖直覺表示了每種氣味的感覺距離,比如花香(floral)、肉味(meaty)和酒香(ethereal)幾個大類彼此間是存在較大感覺距離的;但每個大類下包括的更具體的氣味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感覺距離則較為接近。

論文将POM和此前有過研究先例的基于摩根指紋的氣味空間圖(Morgan fingerprint-based maps)進行了對比,發現後者尚無法展現上述感覺距離:

當AI學會了聞味兒,人類就可以少工作70年

為了進一步驗證模型訓練效果,研究者接着找來了15位氣味專家,來和模型比拼誰識别氣味更準确。

15位專家每人需要聞400種氣味,研究者會給出55個氣味形容詞,讓他們就每種氣味對這55個選項用1-5分來打分,評定每個氣味形容詞在多大程度上适合于這個氣味。

結果發現,對于其中53%的測試分子,模型的表現都優于小組成員的平均值。

研究者還将模型的預測結果按氣味描述詞進行了分類,發現除麝香外,模型對分子氣味的預測結果均在人類組的誤差分布中,且在30個氣味描述詞的預測結果中優于人類組中位數:

當AI學會了聞味兒,人類就可以少工作70年

後續,研究者還對模型的性能進行了反複驗證,獲得了較為穩定的分子結構-氣味關系。

下面就進入到了最激動人心的氣味圖譜大規模繪制環節,并最終得到了下面這張圖:

當AI學會了聞味兒,人類就可以少工作70年

你可以把上文那個表示氣味感覺距離的坐标圖了解成是這張圖的無限放大版。論文提到,這張圖中包含了約50萬種氣味分子,當中甚至有許多還沒有被發現或合成出來(但确實能計算出來)。

做個更直覺的比較,如果讓一名訓練有素的人類評價員尋找這些氣味,大概需要連續工作70年才可以全部收集到。

看起來,這篇論文着實是完成了一件大事。這時就有網友發問了,機器為什麼需要聞氣味呢?

其他人也紛紛給出了自己的見解,比如認為可以用于工廠污水處理的品質控制,進行爆炸物、毒品或是屍體的嗅探等等:

當AI學會了聞味兒,人類就可以少工作70年

這樣一來警犬和搜救犬可能要下班了

有人希望可以據此研發出一款好的除臭劑,因為人在進行大量有氧運動比如跑步或舉重後會散發出不好的氣味:

也有人對這一研究成果在醫療方面的應用很感興趣,比如可以用來開發嗅覺喪失症的新療法,或者通過氣味檢測疾病等等:

還有香水行業的從業者覺得這幫了自己大忙,“讓它告訴我的同僚什麼時候他們噴了太多古龍水”:

這些預測事實上都不無道理。首先機器确實可以幫人類解決有時對氣味辨識不準确的問題——研究表明,每個人對氣味的感覺程度都各不相同,會根據感覺和生理信号引發不同反應,其中也受到經驗、期望、個性或情境因素的影響。

而氣味某些時候對人來說又十分重要。

不好的氣味就不用說了,某些有害氣體還可能會危害健康,這時如果可以有機器代替某些特定職業幫助人類或動物作業就再好不過。

而對另一些氣味可以為之帶來好處的職業,比如調香師、廚師、設計師、藝術家和建築師等等,也有調配出更具功能性的氣味的需要。一些場合會将氣味應用在環境中,比如紐約Sloan-Kettering癌症中心會在空氣中散布香草油,以降低患者對于磁共振成像(MRI)測試的幽閉恐懼症;芝加哥期貨交易也會散布特定的香味以降低交易大廳的噪音分貝。

還有研究表明,人類大多數與氣味有關的記憶都來自嬰兒及幼兒時期的最初十年,而語言和視覺所産生的記憶通常在10-30歲之間産生。這部分解釋了氣味可以喚起人遙遠的回憶,而且透過氣味所引起的回憶,經常比視覺或聽覺所引起的回憶,更加情緒傾向。

是以氣味和人類的聯系還是非常緊密的,隻是我們在很多時候并不容易察覺。

網友們的猜想也在論文的作者之一、來自Osmo公司的Alex Wiltschko那裡得到了驗證。他在釋出在Osmo官網的一篇文章中寫道,

“氣味圖譜是我們實作更遠大目标的基礎。如果可以開發出能夠複制我們鼻子或狗的鼻子的功能系統,我們就可以盡早發現疾病;人工智能也将幫助醫生找到更有可能在臨床上取得成功的藥物,更好地幫助合成化學家和調香大師進行工作……我們未來的工作目标是,為改善人類健康和幸福奠定堅實的科學和商業基礎。”

不過他也表示,論文依然存在諸多不足。

比如,無法展現分子氣味的濃淡,隻能預測它聞起來是什麼樣;隻對單個分子氣味進行了預測,現實生活中更多卻是混合氣味;而即便是所有的能力都達到了,對氣味的複制和還原也将是很大的挑戰等等。

最後,說了這麼多,有一個網友的評論倒是很樸實,“我覺得這會讓品酒失去樂趣”:

繼續閱讀