天天看點

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

作者:星環科技

語言大模型(LLM)主導的生成式AI(GenAI)毫無疑問将是未來幾年最重要的生産力工具,不但突破以前AI應用無法突破的極限,而且将重塑各行各業,并深刻改變企業的各個産業環節。

“未來已至,隻是還沒有均勻分布”。随着資料量的爆炸性增長、高度可擴充的算力的普及、算法的突破,以及機器學習技術與工具等的不斷進步,生成式AI登上了時代的舞台。那麼企業如何開啟GenAI的新征程呢?

7月6日,2023世界人工智能大會(WAIC)在上海隆重開幕。作為2023世界人工智能大會的戰略合作夥伴,第六次參加的星環科技發揮大資料基礎軟體方面的優勢,在大會上展出了大模型應用開發全周期的技術和産品,在算力及基礎軟體層,包括星環分布式向量數資料庫Hippo、分布式圖資料庫StellarDB、大資料開發工具TDS等衆多的基礎軟體與工具;在開發者工具層,提供了大模型統一營運管理平台Sophon LLMOps等,實作對模型訓練、調優;在應用層則是面向使用者的領域大模型,如星環無涯Infinity和星環SoLar求索。

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具
第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

同時,7月7日,星環科技還将在WAIC上舉辦“大模型時代的未來資料技術”論壇,讓大資料智能化、多模态、平民化,将擁有廣闊前景的GenAI技術送出給每一個企業使用者手中,讓企業開啟大模型和生成式AI應用的新征程!

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

企業自有大模型應用建構流程圖

金融、能源、交通等每個行業都會有自己的領域大模型

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

星環科技創始人、CEO孫元浩在大會上表示,未來在金融、政府、能源、交通等每一個行業與領域,都會誕生領域或者行業的大模型,這些大模型具有專家的能力,可以在上面構造複雜的應用。

在特定領域,領域大模型将會成為發展的主流。比如金融行業,會出現金融量化大模型,為基金經理投資提供決策輔助支援;在傳統行業比如冶金領域,基于大模型驅動的控制技術應用将得到快速發展等。

在領域大模型落地和發展中,不僅需要長期積累高品質的資料、經驗、流程和知識,利用行業積累對領域模型調優,利用業務回報持續提升大模型,而且需要擁有基礎領域模型、基礎開發軟體、基礎工具軟體,以保證行業領域大模型的持續提升。

由于大模型回報的結果是基于對訓練語料的學習而産生的答案,是以行業大模型在具體的落地過程中,需要學習大量行業的專精語料和經驗知識,才能確定傳回結果的精準性和專業度。

在大模型應用的實際業務工作中,往往會因為新釋出的政策法規、新發生的行業重大事件,以及最新的生産經營情況變化等,需要做出快速響應。相應地,基于曆史語料和經驗知識訓練的領域大模型要想對瞬息萬變的經營環境做出及時的政策調整和回報,就需要不斷通過新增訓練語料和實時資訊來進行回報結果的調優。

大模型提出了一種新的人機互動範式,但“一招鮮吃遍天”的大一統解決方案較難實作,圍繞大模型在完成對已有業務的增值和創新中,需要使用向量資料庫、圖資料庫、知識圖譜、大模型編排和建構工具等,彌補大模型本身的實時性、幻覺缺陷或者長輸入難題,組合、串聯、增強各業務零散方案,統一到大模型的互動範式中去。

孫元浩認為,在現有數字化和智能化轉型中,大陸應該建構供應鍊安全的、自主可控的、豐富的、可信的大模型生态,并直接對業務的增強、融合、創新做出價值貢獻。

星環科技作為一家大資料基礎軟體供應商,依然會專注在基礎軟體領域,将緻力于做好兩點:一是為行業提供一系列基礎軟體和工具,結合客戶資深的行業知識、行業積累,讓客戶、合作夥伴能夠打造出自己的行業領域大模型,并在大模型上開發出AI應用;二是在擅長的領域研發領域基礎大模型,使得大資料取數分析等這一專業過程變得更加平民化。

星環無涯Infinity和星環SoLar求索兩大領域大模型亮相

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

目前通用大模型商業化落地面臨不少問題,如大模型雖然在了解人類自然語言、歸納生成文本、圖像生成上等有驚人的表現,但是它依然無法了解行業術語,也不能夠執行行業的特定任務,還不能像專家一樣,針對行業做分析、推理和決策。

另一方面,企業要建構行業大模型,需要投資算力、基礎大模型、LLMOps工具鍊、語料庫、訓練指令集,還需進行上層應用的開發。同時,大模型訓練的成本很高,導緻其生成的内容中資料沒能及時更新,同時大模型還會存在幻覺問題,需要知識庫校正結果。在具體場景中的商業化落地,通用大模型還不能滿足準确、可信、安全、可溯等高需求,還會存在資料安全、倫理等問題。

在今年的WAIC上,星環科技的兩大領域大模型——金融領域大模型“無涯”(Infinity)和大資料分析大模型“求索”(SoLar)成功化解以上挑戰,開始投入應用,受到使用者的歡迎。

其中,星環無涯Transwarp Infinity支援股票、債券、基金、商品等市場事件的全面複盤、總結及演繹推理,以及政策研報的深度分析,為基金經理提供決策輔助。

具體而言,星環無涯Transwarp Infinity金融大模型是業界首款面向金融智能量化投研的領域大模型,将在金融投研、量化投資和智能推理領域大顯身手,有力輔助分析師、研究員和投資經理的日常工作,幫助企業更好地應對複雜的市場環境和業務需求,持續促進整體行業的降本增效與科技創新。

星環無涯融合了輿情、資金、人物、空間、上下遊等多模态資訊,具備強大的了解和生成能力,支援股票、債券、基金、商品等市場事件的全面複盤、總結及演繹推理,以及政策研報的深度分析。基于事件驅動與深度圖引擎,星環無涯支援事件語義刻畫、定價因子挖掘、時序編碼、異構關系圖卷積傳播,進而建構包含事件沖擊、時序變化、截面關聯和決策博弈等多個次元的量化投研新範式。

從應用上看,無涯Infinity金融大模型擁有海量金融專業語料和輿情工商産業鍊大宗衛星等多源資料,可溯因的标準化因子和歸因解釋體系,高精準、強邏輯的事理分析與推斷力,專注于金融領域的大語言模型架構,背靠大資料全生命周期技術棧等優勢。

而Transwarp SoLar具備大資料行業需求了解、推理、各類(含多模型)結構化查詢語言和OpenCypher代碼生成、文本生成、嵌入向量生成、知識推理等能力。

借助這一領域大模型,企業的業務人員、資料分析人員以及業務管理者隻需使用自然語言,就能利用Transwarp SoLar大模型擷取所需的資料分析、展示和報告,輕松地應對各種複雜的資料分析挑戰,并快速獲得有價值的資料洞察,為企業的業務增長提供原動力。

星環求索大模型基于通用大語言模型,通過對大資料分析領域語料的重新訓練微調而産生,相較于通用大語言模型,可以更好地了解大資料分析領域的專業術語、縮寫、常見詞彙和文法,更适合用于大資料分析領域的自然語言處理任務。星環求索讓非專業使用者在無需掌握資料庫程式設計語言的前提下,能夠通過自然語言進行自由的資料查詢、分析和展示。

星環求索大資料分析大模型擁有衆多優勢,包括行業基因,在大資料分析領域擁有超過10年的積累,深刻了解該行業的需求和挑戰;性能優異,基于Sophon LLMOps大模型開發工具進行大模型的微調,性能表現遠勝開源模型;疊代提升,自主研發了SQL衆包工具,持續根據資料驅動來提升模型性能;支援多模,産品支援TDH多模型查詢文法,可以查詢一切可查詢的資料等。

大模型基礎開發軟體與工具讓企業便捷建構領域大模型

第六次亮相WAIC 星環科技全面展示大模型應用開發全周期産品與工具

在WAIC上星環科技另一個吸睛的地方就是為領域大模型發展提供的一系列基礎軟體和工具,不僅包括模型持續提升和持續開發工具Sophon LLMOps,可以對大模型進行微調,也包括向量資料庫、圖資料庫、知識圖譜等軟體,讓客戶、合作夥伴能夠打造出自己的行業領域大模型,并在大模型上開發出AI應用。

作為星環科技自主研發的一款綜合性大模型統一營運管理平台,Sophon LLMOps為使用者打通從資料接入和開發、提示工程、大模型微調、大模型上架部署到大模型應用編排和業務效果對齊的全鍊路流程,進而實作針對大模型的資料和分析的持續提升。

針對智能問答系統在各個業務環節中的應用需求,Sophon LLMOps提供了領域智能問答解決方案。借助星環 Sophon LLMOps ,使用者可以輕松完成資料采集、知識沉澱、大模型疊代提升的完整閉環。通過跨領域知識的學習和調優,大語言模型能更好地了解不同領域的專業術語、縮寫、常見詞彙和文法,承擔統一的語義了解功能,解決業務領域性問題。

作為一款企業級雲原生分布式向量資料庫,星環分布式向量資料庫Hippo支援存儲、索引以及管理海量的向量式資料集,提供向量相似度檢索、高密度向量聚類等能力,有效地解決了大模型在知識時效性低、輸入能力有限、準确度低等問題,讓大模型更高效率地存儲和讀取知識庫,降低訓練和推理成本,激發更多的AI應用場景。

在賦予大模型擁有“長期記憶”的同時,Hippo還可以協助企業解決目前最擔憂的大模型資料隐私洩露問題。通過建立垂直領域的知識庫,對大模型輸出結果進行校正,可以提高結果的精準度,在一定程度上解決“AI幻覺”問題。此外,通過星環Hippo對向量資料進行存儲,有效解除大模型對輸入的限制,并且大模型在安全機制下通路向量資料庫中的隐私資料,可以充分保證資料安全,杜絕隐私洩露風險。

星環分布式圖資料庫StellarDB和知識圖譜平台Sophon KG聯合,與大模型可視化端到端建構工具一起,提供了知識抽取融合、知識模組化、知識圖譜生成存儲、基于大模型的知識問答等閉環功能。客戶以知識圖譜作為大語言模型提示即可發起模型微調,以較低代價就可獲得行業的專屬大語言模型問答應用。

将向量資料庫Hippo、圖資料庫StellarDB等與大語言模型結合,可以更低成本、更高效地建構特定領域的大模型應用,可以解決大模型目前存在的三大問題:一是能夠把實時的知識、變化的資訊放到大模型中;二是能夠校正結果的準确性,極大地提升精準度;三是建構相應的知識圖譜,增強大模型的能力。

另外,針對目前各行業使用者在落地廣泛業務需求分析、處理多重資料模态對接、跟進高度定制場景問題解決、營運多源多架構AI模型等方面的問題,星環科技自主研發的一站式智能分析工具平台Sophon提供“六易三倉兩中心”的功能服務,能夠保障企業資料到智能應用的落地,實作AI能力平民化、AI價值最大化。

例如某制造業客戶通過Sophon的AI技術以及視訊、圖像、時序等多模态資料的聯合分析技術,對其生産的鋼管材進行缺陷檢測識别,支援夾渣、未焊透、未熔合、氣孔、裂紋5類基本缺陷類型的識别,并支援新增和識别随着日常的生産不斷湧現的新缺陷。

某德國汽車品牌基于Sophon的多模态資料分析能力,盤活了監管機構、來源網站、法規條款(PDF等)等多模态的存量資料,并且通過文本分析、詞法分析、糾錯和統一轉換等文本了解和意圖識别模型,實作了資料知識沉澱,以及行業法規條款的自動語義檢索和問答,幫助内部員工快速觸達監管條款細節,提升效率。

利用星環科技的基礎開發軟體與工具,企業都可以便捷建構領域大模型,讓生成式AI應用服務企業業務創新。

繼續閱讀