天天看點

快手APP上了大模型對話,這是機器之心一手體驗

作者:機器之心Pro

機器之心報道

編輯:澤南

短視訊平台的大模型之戰已經打響?

快手的 AI 大模型落地應用,就這樣悄然開始了。

8 月 18 日晚,快手公布了基于自研大語言模型應用的最新進展 ——「快手 AI 對話」 功能已經在快手 APP 安卓版開放了内測。

快手APP上了大模型對話,這是機器之心一手體驗

不需要 demo 網站,也不用獨立的分類,快手這項新功能直接放在了安卓的正式版 APP 上。這個搜尋框旁邊的 AI 對話按鈕,獲得測試資格的使用者點選即可進入。

「快手 AI 對話」是短視訊直播行業首個基于大語言模型的類 ChatGPT 落地産品。我們期待已久了,它體驗如何呢?

第一時間評測

機器之心第一時間獲得了内測資格,讓我們看看快手的大模型産品處于什麼水準。

每家的大模型都各有特點,先讓它介紹下自己的能力,好判斷一下該從哪開始聊起。

快手APP上了大模型對話,這是機器之心一手體驗

它說自己能回答「任何問題」,也可以提供建議,進行說明,當然也可以和你閑聊,看起來是有點革新搜尋引擎的意思。那就先問它一個讓人頭疼的問題:

不僅有回答,令人驚喜加意外的是,它還能推薦快手上相關的視訊,看起來用 AI 找資源會很友善。

搜尋更多的概念,我們發現它不僅可以和人持續聊天對話,也可以在給出回答時附帶引用内容的連結,做到有理有據。如果查詢個天氣什麼的,就會直接顯示個天氣預報的卡片。

從快手那邊得到的消息是,這種卡片形式的工具還會越來越多。

快手APP上了大模型對話,這是機器之心一手體驗

從這裡,我們也能看出快手對大模型技術落地應用的思考:充分發揮自身優勢。聰明的智能可以依靠站内豐富的内容生态,通過互動對話的形式幫你快速查找短視訊、達人、百科等内容。這是一種全新的資訊擷取形态。

同時,快手 AI 對話也為快手搜尋打破了站内内容的壁壘,可為使用者提供全網内容的檢索服務。你的下一個搜尋引擎,又何必是搜尋引擎。

值得一提的是,在我們測試時,快手 AI 回答每個問題的響應速度都是很快的。已知單 A100 在高度量化(用 llama.cpp)的條件下推理 Llama 的速度是每秒 30 個詞,難道我現在正在用的是一塊英偉達 A100?可以未經預告直接在應用裡上線,想必工程師們已經做了不少優化。

接下來,國内的大模型都說自己的中文語義了解水準有優勢,我們讓它來做一道今年的聯考國文題:

快手APP上了大模型對話,這是機器之心一手體驗

回答無誤,再試試實體題:

快手APP上了大模型對話,這是機器之心一手體驗

理科題目也能做對,可見快手 AI 是讀過不少書的。

作為一款大語言模型,文案創作水準必須要高。大多數公司釋出的大模型都可以快速生成内容豐富的文章、建議和回複,但很多生成的文字隻是看似可以用,實則經不起推敲。對于一些特定的任務,或是需要深入了解語境,符合人類情感的問題來說,有時候 AI 會輸出一些奇怪的結果。

在快手上我們總會遇見各路高人,但大多數人都是新手,能不能利用 AI 的幫助快速漲粉呢?值得嘗試一下。最近大熱的話題是電腦裝機,我想幹翻奸商,開個裝機店:

快手APP上了大模型對話,這是機器之心一手體驗

快手大模型給出了長長的建議,從确立定位、了解行情到教育訓練員工、制定營銷政策…… 數了數一共有八條。從前人實踐來看,在做這種大事時很有可能忽略某些細節,AI 助手的思維是更加缜密的,給人一種靠得住的感覺。

我們繼續和它聊,在看完快手建議選好店鋪名字之後,如何拍攝一個視訊宣傳我的店鋪呢?

快手APP上了大模型對話,這是機器之心一手體驗

看上去内容中規中矩,似乎并沒有快手老鐵别具一格的思路,不過要給哪些鏡頭都說得很清楚。

既然你說話這麼嚴謹,那考考你邏輯問題吧:

快手APP上了大模型對話,這是機器之心一手體驗

弱智吧裡出現的問題,在這裡根本難不倒它,不過是否精彩是回答的藝術。

那崩鐵裡用來對付民科的教育部難題又該如何呢?

快手APP上了大模型對話,這是機器之心一手體驗

雖然沒有做對,但我們知道這題的答案并不是三個選項裡的任何一個(在遊戲裡後續對話會出現正确選項 162),AI 給出的答案算比較接近了。

最近,開源的 Llama 2 正在改變大模型領域的格局,有了一個堪比早期 GPT 的開源産品,衆多公司會朝哪些方面進一步探索?

快手APP上了大模型對話,這是機器之心一手體驗

在技術和落地上都還有很多要做的事,卷是一定的,機會當然也很多。

快手大模型,有備而來

大模型是如今衆多科技公司競争的重要賽道,在這方面,快手早有準備。

今年 5 月一季度的業績電話會上,快手科技創始人兼 CEO 程一笑曾透露,公司已經組建了大模型研發團隊,依托過去在 AIGC 算法和大語言模型方面的技術積累,正在按計劃推進大模型開發和訓練,各項進展順利。

事實上,已有消息表明快手在大模型落地方面進展迅速。

據透露,和目前很多科技公司展示的大模型 demo 相比,「快手 AI 對話」利用對内部資源的高效索引,部分解決了大語言模型的幻覺問題,提升了問答的準确性,另一方面也很早就在多個應用場景開始了産品和功能的探索。

在 7 月 8 日,快手宣布正在内測智能問答産品,計劃在搜尋場景中為使用者帶來智能問答和文本創作等新功能,随後在 8 月 8 日開啟「快手 AI 對話」内測。以搜尋場景為入口,我們獲得了更加便捷的搜尋形态,新技術帶來的便利覆寫也更廣泛。

今天上午,這些産品功能背後的快手大模型終于浮出水面。有媒體報道稱,來自快手 AI 團隊的自研大模型 ——「快意」(KwaiYii)已開啟内測,并為業務團隊提供了标準 API 和定制化項目合作方案。該大模型甫一出世便在多個知名大模型排行榜上均位居前列,在最新的 CMMLU 中文向排名中更是居于首位。

快手APP上了大模型對話,這是機器之心一手體驗

KwaiYii-13B 在 CMMLU 中文向排名第一。

根據其 GitHub 首頁介紹,「快意」是由快手 AI 團隊從零到一獨立研發的大規模語言模型,而本次引發關注的正是其新版本 KwaiYii-13B。該模型在多個 Benchmark 上都處于領先水準,證明了其在自然語言處理任務中的出色性能。

其中,KwaiYi-13B-Base 預訓練模型具備優異的通用技術底座能力,在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規模的領先水準,顯示了快意大模型在中文和英文上都具備非常強悍的能力。

快手APP上了大模型對話,這是機器之心一手體驗

KwaiYii-13B-Base 在 Benchmark 上的效果(來源:快意 GitHub 首頁)。

而 KwaiYii-13B-Chat 對話模型具備出色的語言了解和生成能力,支援内容創作、資訊咨詢、數學邏輯、代碼編寫、多輪對話等廣泛任務,人工評估結果表明 KwaiYi-13B-Chat 超過主流的開源模型,并在内容創作、資訊咨詢和數學解題上接近 ChatGPT (3.5) 同等水準。

更值得期待的是,機器之心了解到,快手 AI 團隊将持續疊代「快意」大模型,一方面将繼續優化模型性能并研發多模态能力 ,另一方面也在推進更多 C 端與 B 端業務場景下的落地 。

從生産力工具、手機 OS 到短視訊直播平台,國内大模型隻花幾個月就快速覆寫了各種平台,背後的技術也越來越靠譜。變革到了這一步,量變已在産生質變。

大模型的到來,正讓我們進入一個全新的世界。