快手APP上了大模型對話，這是機器之心一手體驗

機器之心報道

編輯：澤南

短視訊平台的大模型之戰已經打響？

快手的 AI 大模型落地應用，就這樣悄然開始了。

8 月 18 日晚，快手公布了基于自研大語言模型應用的最新進展 ——「快手 AI 對話」功能已經在快手 APP 安卓版開放了内測。

不需要 demo 網站，也不用獨立的分類，快手這項新功能直接放在了安卓的正式版 APP 上。這個搜尋框旁邊的 AI 對話按鈕，獲得測試資格的使用者點選即可進入。

「快手 AI 對話」是短視訊直播行業首個基于大語言模型的類 ChatGPT 落地産品。我們期待已久了，它體驗如何呢？

第一時間評測

機器之心第一時間獲得了内測資格，讓我們看看快手的大模型産品處于什麼水準。

每家的大模型都各有特點，先讓它介紹下自己的能力，好判斷一下該從哪開始聊起。

它說自己能回答「任何問題」，也可以提供建議，進行說明，當然也可以和你閑聊，看起來是有點革新搜尋引擎的意思。那就先問它一個讓人頭疼的問題：

不僅有回答，令人驚喜加意外的是，它還能推薦快手上相關的視訊，看起來用 AI 找資源會很友善。

搜尋更多的概念，我們發現它不僅可以和人持續聊天對話，也可以在給出回答時附帶引用内容的連結，做到有理有據。如果查詢個天氣什麼的，就會直接顯示個天氣預報的卡片。

從快手那邊得到的消息是，這種卡片形式的工具還會越來越多。

從這裡，我們也能看出快手對大模型技術落地應用的思考：充分發揮自身優勢。聰明的智能可以依靠站内豐富的内容生态，通過互動對話的形式幫你快速查找短視訊、達人、百科等内容。這是一種全新的資訊擷取形态。

同時，快手 AI 對話也為快手搜尋打破了站内内容的壁壘，可為使用者提供全網内容的檢索服務。你的下一個搜尋引擎，又何必是搜尋引擎。

值得一提的是，在我們測試時，快手 AI 回答每個問題的響應速度都是很快的。已知單 A100 在高度量化（用 llama.cpp）的條件下推理 Llama 的速度是每秒 30 個詞，難道我現在正在用的是一塊英偉達 A100？可以未經預告直接在應用裡上線，想必工程師們已經做了不少優化。

接下來，國内的大模型都說自己的中文語義了解水準有優勢，我們讓它來做一道今年的聯考國文題：

回答無誤，再試試實體題：

理科題目也能做對，可見快手 AI 是讀過不少書的。

作為一款大語言模型，文案創作水準必須要高。大多數公司釋出的大模型都可以快速生成内容豐富的文章、建議和回複，但很多生成的文字隻是看似可以用，實則經不起推敲。對于一些特定的任務，或是需要深入了解語境，符合人類情感的問題來說，有時候 AI 會輸出一些奇怪的結果。

在快手上我們總會遇見各路高人，但大多數人都是新手，能不能利用 AI 的幫助快速漲粉呢？值得嘗試一下。最近大熱的話題是電腦裝機，我想幹翻奸商，開個裝機店：

快手大模型給出了長長的建議，從确立定位、了解行情到教育訓練員工、制定營銷政策…… 數了數一共有八條。從前人實踐來看，在做這種大事時很有可能忽略某些細節，AI 助手的思維是更加缜密的，給人一種靠得住的感覺。

我們繼續和它聊，在看完快手建議選好店鋪名字之後，如何拍攝一個視訊宣傳我的店鋪呢？

看上去内容中規中矩，似乎并沒有快手老鐵别具一格的思路，不過要給哪些鏡頭都說得很清楚。

既然你說話這麼嚴謹，那考考你邏輯問題吧：

弱智吧裡出現的問題，在這裡根本難不倒它，不過是否精彩是回答的藝術。

那崩鐵裡用來對付民科的教育部難題又該如何呢？

雖然沒有做對，但我們知道這題的答案并不是三個選項裡的任何一個（在遊戲裡後續對話會出現正确選項 162），AI 給出的答案算比較接近了。

最近，開源的 Llama 2 正在改變大模型領域的格局，有了一個堪比早期 GPT 的開源産品，衆多公司會朝哪些方面進一步探索？

在技術和落地上都還有很多要做的事，卷是一定的，機會當然也很多。

快手大模型，有備而來

大模型是如今衆多科技公司競争的重要賽道，在這方面，快手早有準備。

今年 5 月一季度的業績電話會上，快手科技創始人兼 CEO 程一笑曾透露，公司已經組建了大模型研發團隊，依托過去在 AIGC 算法和大語言模型方面的技術積累，正在按計劃推進大模型開發和訓練，各項進展順利。

事實上，已有消息表明快手在大模型落地方面進展迅速。

據透露，和目前很多科技公司展示的大模型 demo 相比，「快手 AI 對話」利用對内部資源的高效索引，部分解決了大語言模型的幻覺問題，提升了問答的準确性，另一方面也很早就在多個應用場景開始了産品和功能的探索。

在 7 月 8 日，快手宣布正在内測智能問答産品，計劃在搜尋場景中為使用者帶來智能問答和文本創作等新功能，随後在 8 月 8 日開啟「快手 AI 對話」内測。以搜尋場景為入口，我們獲得了更加便捷的搜尋形态，新技術帶來的便利覆寫也更廣泛。

今天上午，這些産品功能背後的快手大模型終于浮出水面。有媒體報道稱，來自快手 AI 團隊的自研大模型 ——「快意」（KwaiYii）已開啟内測，并為業務團隊提供了标準 API 和定制化項目合作方案。該大模型甫一出世便在多個知名大模型排行榜上均位居前列，在最新的 CMMLU 中文向排名中更是居于首位。

KwaiYii-13B 在 CMMLU 中文向排名第一。

根據其 GitHub 首頁介紹，「快意」是由快手 AI 團隊從零到一獨立研發的大規模語言模型，而本次引發關注的正是其新版本 KwaiYii-13B。該模型在多個 Benchmark 上都處于領先水準，證明了其在自然語言處理任務中的出色性能。

其中，KwaiYi-13B-Base 預訓練模型具備優異的通用技術底座能力，在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規模的領先水準，顯示了快意大模型在中文和英文上都具備非常強悍的能力。

KwaiYii-13B-Base 在 Benchmark 上的效果（來源：快意 GitHub 首頁）。

而 KwaiYii-13B-Chat 對話模型具備出色的語言了解和生成能力，支援内容創作、資訊咨詢、數學邏輯、代碼編寫、多輪對話等廣泛任務，人工評估結果表明 KwaiYi-13B-Chat 超過主流的開源模型，并在内容創作、資訊咨詢和數學解題上接近 ChatGPT (3.5) 同等水準。

更值得期待的是，機器之心了解到，快手 AI 團隊将持續疊代「快意」大模型，一方面将繼續優化模型性能并研發多模态能力，另一方面也在推進更多 C 端與 B 端業務場景下的落地。

從生産力工具、手機 OS 到短視訊直播平台，國内大模型隻花幾個月就快速覆寫了各種平台，背後的技術也越來越靠譜。變革到了這一步，量變已在産生質變。

大模型的到來，正讓我們進入一個全新的世界。