天天看點

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

作者:智東西
訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

4月26日,訊飛星火大模型V3.5(以下簡稱“訊飛星火”)春季上新。面向使用者高效準确知識擷取的痛點,科大訊飛釋出業界首個長文本、長圖文、長語音大模型,不僅能夠把各種資訊來源的海量文本、圖文資料、會議錄音等進行快速學習,還能夠在各種行業場景給出專業、準确回答。

科大訊飛進一步更新星火語音大模型,首發多情感超拟人合成,具備情緒表達能力,并推出一句話聲音複刻功能,讓科技更有溫度。

同時,面向企業應用場景,科大訊飛推出星火智能體平台,幫助企業解決大模型落地的最後一公裡難題。

持續用技術進步解決真實剛需,訊飛星火也在獲得越來越多使用者的認可。據七麥資料顯示,訊飛星火APP在安卓端的下載下傳量已經超過9600萬次,在國内工具類通用大模型APP中排名第一。

首發長文本、長圖文、長語音大模型,助力知識高效擷取

為什麼科大訊飛要做長文本、長圖文、長語音的大模型?

通過訊飛星火APP可以看到,使用者使用的最高峰不是周末,而是工作日的上午9:30和下午3:30。這意味着,大部分使用者用訊飛星火來解決和工作相關的剛需問題。而高效的知識擷取是使用者和開發者都高度關注的問題。

科大訊飛分析發現,在知識擷取和學習的過程中,廣大使用者能拿到的資料往往不僅是現成的長文本,還有随手可見的報刊書籍内容、各種研讨會的PPT内容,老師黑闆上的闆書、同學的筆記,以及各種會議錄音、訪談,各種網上的釋出會、教育訓練教育視訊等,能不能把這些文本、圖檔、語音等都上傳到訊飛星火中,快速地擷取知識?

為此,科大訊飛推出首個支援長文本、長圖文、長語音的大模型,來解決使用者真實場景中多源資訊的擷取需求。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

本次訊飛星火長文本功能全新更新後,具備長文檔資訊抽取、長文檔知識問答、長文檔歸納總結、長文檔文本生成等能力,總體已經達到GPT-4 Turbo 4月最新長文本版本的97%水準,而在銀行、保險、汽車、電力等多個垂直領域的知識問答任務上,訊飛星火長文本總體水準已經超過GPT-4 Turbo。

長文本功能的落地需要解決資訊高效處理的問題:面對上百萬甚至上千萬文字,長文本大模型消耗的運算資源非常大。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

為了解決大模型應用效率和準确率問題,劉慶峰談道,基于訊飛星火V3.5對長文本的了解、學習、回答能力,科大訊飛進行了重要的模型剪枝和蒸餾,進而推出業界性能最優的130億參數的大模型,在效果損失僅3%以内的情況下,使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。測試顯示,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本上,星火大模型的性能都做到業界最優。

面向複雜的圖文場景,科大訊飛在圖文識别、公式識别大賽多年國際第一的技術積累基礎上,首次推出星火圖文識别大模型。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

相比傳統小模型逐行文字識别的限制,星火圖文識别大模型具有三大優勢:1)能夠直接處理非常複雜的版面分析,目前已經覆寫31個典型場景,比如書刊、學術論文、專利、報紙、海報、PPT等,同時能自動識别标注出18類不同的版面要素,比如頁眉、頁腳、标題、段落、表格、公式、印章、手寫等;2)融合篇章上下文語義進行文字識别,識别更精準;3)面向教育、金融、醫療、科研等專業領域深度優化,能自動實作更多領域的專業符号識别。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

根據國際公開的權威英文測試集來看,訊飛星火的圖文識别效果超過微軟和谷歌。從典型應用場景來看,在科研、金融以及企業産品技術文檔等識别效果都處于業界領先地位。

此外,面對廣泛的音視訊資訊高效擷取需求,科大訊飛也推出長語音功能,将國際領先的語音識别和翻譯技術結合起來,可以實作會議錄音、學習視訊等的一鍵研讀,實作音視訊場景的高效知識擷取。

釋出合同助手、更新AI學習機,以技術進步解決真實剛需

訊飛星火長文本、長圖文、長語音能力的更新,進一步推動大模型在各個場景的落地。劉慶峰重點介紹了訊飛星火在招投标、合同、教育等場景下的應用。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

在招投标場景,此前憑借訊飛星火領先的文本了解、邏輯推理和數學能力,科大訊飛和國家能源物資公司在企業采購場景合作了智能無人評審系統,已經在國資委網站上被作為典型案例推薦。據介紹,在國家能源集團已評審5.7萬餘單,評審準确率達97%。這一次,疊加本次更新的長文本和長圖文能力,可以讓評标更便捷、更高效、更準确。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

日常生活中,我們在買賣商品、裝修房屋或者是購買汽車保險時經常會遇到各種各樣的合同,看不懂存在風險怎麼辦?科大訊飛推出星火合同助手,它可以對我們的合同進行風險稽核、合同比對,摘要總結以及合同生成,迅速識别潛在風險漏洞,成為你口袋裡的“法務助手”。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

在教育場景,科大訊飛進一步更新了訊飛AI學習機産品,不僅對作文的批改、對理科的批改更加精準,也讓智能化輔學更有針對性更高效;也結合本次多模态能力更新了百科問答功能,星火大模型了解并融合了大量圖書知識,對于孩子的奇思妙問等複雜問題,“愛因斯坦”和他的大咖虛拟人朋友都能回答,讓孩子們在趣味互動中學知識、長見識,同時提升了孩子主動提問的意願和能力。

智慧黑闆也再次更新,搭載長文本和長語音能力,讓實錄轉寫效率得以提升的同時,提升篇章梳理能力。其次是星火教師助手,融入長文本能力後,可以把優質教輔内容融入,教師在備課的過程中就可以直接融入教輔教參中的内容,進一步豐富備課資源,提升備課效率。

此外,星火科研助手目前已在中國科學院、三亞崖州灣科技城、北京郵電大學、哈爾濱工業大學等機構高校鋪開應用。多模态能力更新下,訊飛星火科研助手也進一步提升了論文問答、綜述生成、實驗解讀等的效果,使得解析的學術資料更加豐富,進一步賦能高校和科研院所的科研工作。

能“情感共鳴”,還能“一句話聲音複刻”

萬物互聯時代下需要更真實的AI語音互動。年初訊飛星火V3.5釋出會上,科大訊飛推出了超拟人對話功能,AI的聲音更自然更真實,拟人度達到了83%,受到使用者的廣泛歡迎。無論是語音可懂度、流暢度還是表現力,效果均超過OpenAI、微軟。

此次科大訊飛釋出多情感超拟人合成,進一步提升了情緒表達的可感覺度,對高興、抱歉、安慰、撒嬌、困惑等情緒表達的可感覺度達到85%以上,AI語音更加生動、真實。

昊鉑HT 2024 款車型行業率先搭載科大訊飛超拟人合成技術,已在4月25日正式全球上市。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

除了超拟人對話,科大訊飛還推出“一句話聲音複刻”功能,一句話就可以定制你的AI助手聲音。比如模仿小朋友的聲音,每天給爺爺奶奶讀書讀報;在我們出差的時候,模仿我們的聲音給孩子講故事。這個功能可以讓世界變得更有溫度。

劉慶峰談道,科大訊飛在個性化語音合成一直處于業界領先,目前已進階至一句話聲音複刻。當年訊飛AI模仿林志玲的聲音需要去台灣錄一個星期的聲音,到後來模仿郭德綱需要一天的聲音,再往後需要5分鐘的錄音,現在一句話就可以模仿。大家可以在訊飛星火APP上體驗。

釋出星火智能體平台,為企業注入新質生産力

自今年1月30日釋出以來,訊飛星火V3.5作為首個全國産算力訓練的大模型,受到了各行業夥伴和開發者的廣泛歡迎。據劉慶峰介紹,大模型雲邊端的整體解決方案正在賦能汽車、家電、營運商等越來越多的行業;在過去不到3個月的時間裡,訊飛新增了55萬實名認證的開發者,其中一半以上來自企業。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

對企業來說,如何高效地擷取和學習知識同樣是痛點,科大訊飛給出的答案是智能體,并面向企業場景推出全新的智能體平台。

企業建構智能體的環節主要涉及任務了解、外部信源打通、内部各個IT系統打通以及私域知識深入融合等環節,最終根據每個任務的執行結果輸出答案,這樣一個完整的過程才能夠最終完成智能體的建構。

訊飛星火首發智能體平台,靈活觸達大模型應用企業落地最後一公裡

劉慶峰談道,在訊飛星火智能體平台上,針對使用者的輸入,首先,基于訊飛星火大模型非常聰明的底座能力,會自動實作使用者輸入的精準了解和任務規劃。其次,解析完了相關的任務和對應的工具之後,訊飛星火也建構形成了包括天氣、航班、企查查等成體系的外部資訊來源的對接;同時,星火智能體平台還通過互認證的機制,實作了往往是獨立的、隔離的OA系統、CRM系統以及ERP系統的打通,完成相應操作;最後,通過私域知識融入機制,智能體平台很容易實作企業所屬行業以及企業私域知識的融入,實作更精準的專業了解和知識問答。

此外,星火智能體平台還可以通過拖拽方式實作新智能體的建立和多智能體的協作。星火智能體平台,靈活觸達大模型應用企業落地的最後一公裡。

據劉慶峰透露,科大訊飛将在6月27日釋出訊飛星火大模型V4.0,進一步解放生産力、釋放想象力。

今年全國兩會上,開展“人工智能+”行動,加快發展新質生産力首次寫入《政府工作報告》。大模型帶來的知識管理革命正在上演,無論企業還是個人,都可以站在人工智能的肩膀上,實作新的比較優勢。

繼續閱讀