天天看點

中譯語通展示格物多語言大模型技術和工業實踐

作者:牛華網

2023年7月18日至20日,第二屆自然語言生成與智能寫作大會(NLGIW 2023)在新疆烏魯木齊召開。中譯語通科技股份有限公司(簡稱“中譯語通”)作為大會戰略合作夥伴,向與會嘉賓展示了公司格物大模型技術和工業實踐。會議還彙聚了騰訊AI Lab、百度等科技企業,學術界和工業界的研究學者與從業人員,分享各自研究成果和實踐經驗,推動了大模型和自然語言生成領域的技術創新與研究成果轉化。

中譯語通展示格物多語言大模型技術和工業實踐

中譯語通作為NLGIW戰略合作夥伴參會展示

本屆會議組織機關為中國中文資訊學會自然語言生成與智能寫作專業委員會(籌),承辦機關為新疆師範大學。大會從特邀報告、講習班、青年學者論壇等各個環節圍繞自然語言生成與大模型展開,包括大語言模型、代碼大模型、多模态大模型的基本原理、高效訓練和推理、有監督微調、人類回報學習、安全與倫理、大模型應用等各個次元開展,為參與者提供一場關于大模型的盛宴。

中譯語通展示格物多語言大模型技術和工業實踐

NLGIW專委主任委員

兼中譯語通2030人工智能研究院院長

趙鐵軍教授出席開幕式并緻辭

會議邀請到了中科院自動化所宗成慶研究員、華為諾亞方舟實驗室劉群教授、哈爾濱工業大學秦兵教授三位知名專家做大會特邀報告。這些報告簡要回顧了生成式語言模型“前世”的基礎上,對大語言模型的“今生”做了簡要分析,系統性地介紹了知識增強的語言模型技術和研究進展,以及從大模型的安全角度出發,探索了大模型安全性内容生成的方法,包括研究大模型辨識是非能力,以及人類普世價值觀,社會文化價值觀及立場對齊上的内容檢測與生成方法,探索AI社會協作式的價值觀對齊機制。

中譯語通展示格物多語言大模型技術和工業實踐

中譯語通2030人工智能研究院副院長陳自岩進行報告發言

在企業論壇環節中,中譯語通2030人工智能研究院副院長陳自岩博士受邀進行題為《格物多語言大模型技術和工業實踐》的發言,針對目前人工智能在工業實踐中面臨的多語言間語義割裂、從資料+需求到應用的端到端的迫切需求、社交互動生成難以達到拟人化程度等挑戰,闡述了中譯語通基于格物大模型解決這些難題的創新技術和成功實踐。

格物大模型是中譯語通于2022年11月釋出的大模型體系,包括了多語言預訓練模型、多語言機器翻譯超大模型、多模态預訓練模型等。陳自岩博士還重點介紹了公司正在研發的新一代多語言生成式對話大模型,該模型以自有的近80億句對高品質平行語料、100多個語種的PB級資料為基礎,融合上下文了解、個性化、思維鍊等高達2000萬規模的高品質業務化指令,并提出領域專家對齊和社交對抗回報的混合強化學習技術,旨在打造時效性較高、千人千面的生成式大模型。

目前公司研發的生成式大模型已在多語言知識圖譜端到端生成、社交媒體行為生成、領域報告寫作等應用場景實作了落地應用,同時針對全球防務安全、科研資料分析、智慧城市和全球戰略資料研究等領域進行全方位技術革新。此外,陳自岩博士與騰訊、百度等企業專家圍繞大模型在應用落地上的難點和應對措施進行圓桌讨論。

中譯語通展示格物多語言大模型技術和工業實踐

中譯語通2030人工智能研究院副院長

陳自岩(左四)代表公司領獎

會議上,中國中文資訊學會自然語言生成與智能寫作專委會為中譯語通等8家企業頒發感謝獎牌,表達各企業對本屆大會的特别支援。

中譯語通展示格物多語言大模型技術和工業實踐

會議現場

中譯語通展示格物多語言大模型技術和工業實踐

中譯語通現場展示多語種自然語言處理算法成果

繼續閱讀