天天看點

知乎CTO李大海:視訊化趨勢下的智能社群多模态探索

2021 waic世界人工智能大會于近日在上海召開。在7月10日舉辦的waic·ai開發者論壇上,知乎合夥人兼cto李大海發表主旨演講,分享了視訊化趨勢下,知乎作為智能社群在多模态領域下的探索和應用實踐。

知乎CTO李大海:視訊化趨勢下的智能社群多模态探索

作為一家問答社群,知乎已經經過十年的發展,業務增長共經過了四個發展階段,從最開始的封閉營運,走向開放,并且不斷的擴大使用者場景和使用者規模。李大海表示,ai技術已經廣泛應用于知乎的每個核心環節,建構智能社群,提升社群效率。随着越來越多的使用者在知乎上通過視訊分享自己的知識、經驗、見解,知乎也認識到,視訊和圖文有各自的優缺點和适用場景,社群需要通過媒介更新,讓視訊變成和圖文一樣重要的内容承載形式。是以,知乎确定了以多模态為核心的視訊智能化技術戰略。

據李大海介紹,知乎已經建構了采用了雙流對比學習架構的圖文多模态預訓練模型。該模型應用已經廣泛應用到知乎的視訊的生産、搜尋分發、話題比對和排序等多個場景中。

知乎CTO李大海:視訊化趨勢下的智能社群多模态探索

去年10月,知乎釋出了圖文一鍵轉視訊創作工具,内部稱為“ppt視訊創作工具”,圖文創作者可以利用這個工具快速把自己的文字回答或者文章生成為一個視訊。轉化過程的主要思路是把文章裡每一段話或者每一個句子,通過模型找到對應的圖檔、動圖或者短視訊,然後通過預訓練模型把每一段文字與素材庫裡圖檔的相關性進行計算。此外還有其他應用,創作者可以主動輸入關鍵詞,在素材庫裡面找到和關鍵詞比對度最高圖檔,讓它自己主動建構視訊素材流。

李大海表示,視訊在社群的融合,可以讓知乎更好地實作自己的使命:“讓人們更好地分享自己的知識、經驗、見解,找到自己的解答”。未來,知乎将基于積累的海量圖文視訊資料,緻力建構綜合圖文、視訊、音頻等媒介于一體的大規模預訓練模型,并将成果完全開放出來,讓學界、業界的更多開發者使用。

繼續閱讀