由垂直領域頭部企業主辦的各類論壇已成為每屆世界人工智能大會(WAIC)的重要組成部分, 7月 7日,在WAIC開幕的第二天,由語言智能科技企業蜜度主辦的“語言智能與内容生成高峰論壇”,在上海浦東世博展覽館拉開帷幕。論壇由國家語委中國語言智能研究中心、中國人工智能學會多語種智能資訊處理專委會、哈爾濱工業大學計算學部協辦,上海市人工智能行業協會支援。多位業内知名專家學者、行業企業技術專家齊聚現場,交流分享語言智能與内容生成領域的技術創新與應用實踐。論壇現場,蜜度釋出了自研的國内首個專為智能校對領域打造的垂直大語言模型——蜜度文修。
蜜度文修重磅釋出 特定任務表現優于通用大模型ChatGPT
在語言智能與内容生成高峰論壇上,蜜度文修正式釋出。唐宋八大家之一的歐陽修曾任館閣校勘,校對亦有修文之意,“蜜度文修”便取名于此。蜜度文修專為校對這一垂直專業領域打造,在中文拼寫勘誤、文法糾正任務上的表現顯著優于通用大模型ChatGPT。
蜜度文修釋出儀式
蜜度文修以大語言模型(LLM)為技術底座,通過運用高品質資料學習多種特色子任務,大幅度提升中文校對和潤色能力的智能化程度。截至目前,在公開測試語料評測結果中,蜜度文修實作各類校對項目F1值(模型精确率與召回率的調和平均數,用以闡述模型完成指定任務的品質)的全面SOTA(state-of-the-art,指模型在指定任務中的表現為目前業界最優)。蜜度文修以卓越的實力,不僅輔助專業使用者提高校對品質、提升校對速度、降低差錯率,也為新聞出版、媒體稿件、政務公文等專業領域帶來革命性的工作模式疊代與效率提升,為新時代語言文字工作高品質發展注智賦能。
其實,早在2020年,蜜度就推出了智能文本檢測服務,并以深度學習模型為方向,嘗試智能化地解決基礎校對問題。蜜度還成立了多語言校對檢測實驗室,圍繞“文字标點差錯”、“知識性差錯”、“内容導向風險識别”三個主要能力開展建設。在2022年的WAIC上,蜜度釋出了支援本地化部署的蜜度校對通AI-Box,而這也是首個通過華為昇騰AI生态認證的自然語言處理智能文本校對應用解決方案。2023年初,蜜度智能校對系統成功地入選國家新聞出版署2022年出版業科技與示範創新項目“科技創新成果”。
今年4月,蜜度智能校對多語言版正式上線,除了漢字、英文之外,還覆寫了蒙古文、藏文、維吾爾文、北韓文、壯文、哈薩克文、傣文、烏孜别克文、柯爾克孜文、俄羅斯文、彜文、傈僳文共計12種少數民族語言文字。6月,蜜度正式推出中文潤色服務,重點解決用詞不當、句式雜糅等措辭與表述問題。
一個月後,在2023年的WAIC現場,蜜度推出全新的蜜度文修,讓大模型時代的全新工作範式走入校對場景,除了重新整理多類校對任務的最佳效果之外,完善了過去較為薄弱的易混詞細微語義辨析難題,同時在尊重原意表達的基礎上,更好地修正句式雜糅、邏輯錯亂等問題,使句子表達更流暢,實作對句子的潤色功能。蜜度文修的釋出,可以視為蜜度在大模型時代,采用與時俱進的前沿科技積極賦能垂直辦公場景的一次實踐。
論壇現場還舉行了科大訊飛與蜜度的合作簽約儀式,科大訊飛開放平台總經理張斌與蜜度首席執行官翟光景簽署合作協定。未來,雙方将深化各自技術優勢,攜手推進智能校對産業的進階,共同賦能行業生态,為更多企業及機構提供高品質的智能化校對服務。
科大訊飛與蜜度合作簽約儀式
語言智能與内容生成高峰論壇:未來更可期
除了蜜度文修大模型的重磅釋出之外,論壇現場彙集了行業洞見思考及先驅科研讨論。論壇由哈爾濱工業大學計算學部長聘教授、人工智能研究院副院長車萬翔主持,微網誌COO、新浪移動CEO、新浪AI媒體研究院院長王巍緻辭。
随後,業内重量級專家學者進行了主旨演講。矽谷人工智能研究院(SVAIRI)創始人、《矽谷百年史》與《人類2.0》的作者皮埃羅·斯加魯菲帶來在《Transformer模型——新型内容生成計算機架構》的主旨演講。國務院國有資産監督管理委員會新聞中心副主任、《國資報告》雜志社總編輯闫永則以《AIGC時代全媒體傳播内容的供給側改革》為題進行主題分享;國家語委中國語言智能研究中心主任、中國人工智能學會語言智能專委會主任周建設分享了語言智能與智性工具革命間的内容;哈爾濱工業大學計算學部教授、自然語言處理研究所副所長秦兵則發表了題為《大語言模型之安全性檢測及人類價值觀對齊》的主旨演講,關注人工智能發展征程中繞不開的安全與倫理議題;中國人民大學資訊資源管理學院副教授夏天以《智能校對領域大語言模型的探索與實踐》為題,回顧了校對場景下AI能力的幾次裡程碑式躍升,也對大模型時代的智能校對産品提出了新的希冀。
随後,來自不同領域的學者專家共同探讨了技術變革帶來的機遇和挑戰。蜜度首席技術官劉益東主持讨論,中國資訊通信研究院雲計算與大資料研究所内容科技部主任石霖,複旦大學新聞學院教授、副院長周葆華,人民中科(北京)智能技術有限公司總裁餘昊楠,中國科學院資訊工程研究所副研究員周薇與科大訊飛AI雲産品總監張林芳帶來精彩見解。
蜜度于WAIC盛會期間主辦語言智能與内容生成高峰論壇,交流分享語言智能與内容生成領域的技術創新與應用實踐,用創新助推大模型的演進,持續以優秀的模型能力,解決真實場景中的使用者需求,為數字政府、數字營銷、數字媒體、數字城市的建設提供全方位的智能應用解決方案,深度賦能政府與企業辦公場景的數字化、智能化轉型更新,為千行百業的革新發展提供動力。