想象一下,向人工智能(AI)聊天機器人詢問一個不存在的曆史事件,比如“誰赢得了1897年美國和南極洲之間的戰鬥?”即使沒有這樣的戰鬥,AI聊天機器人也可能會提供一個虛構的答案,例如“1897年的戰鬥是由美國赢得的,約翰·多伊将軍帶領部隊取得了勝利。”這種AI編造資訊“一本正經地胡說八道”的情況屢見不鮮。
在專業領域,AI“一本正經地胡說八道”這種現象被稱為AI幻覺。“AI幻覺指的是AI會生成貌似合理連貫,但同輸入問題意圖不一緻、同世界知識不一緻、與現實或已知資料不符合或無法驗證的内容。”日前,長期從事自然語言處理、大模型和人工智能研究的哈爾濱工業大學(深圳)特聘校長助理張民教授在接受采訪時表示。
AI幻覺普遍存在
通過梳理發現,AI幻覺具有普遍性。
2023年2月,谷歌釋出的AI聊天機器人Bard在視訊中,對詹姆斯·韋布空間望遠鏡曾做出不真實陳述;3月,美國的兩名律師向當地法院送出了一份用ChatGPT生成的法律文書,這份文書格式工整、論證嚴密,但其中的案例卻是虛假的……
OpenAI研究人員雖曾在2023年6月初釋出報告稱“找到了解決AI幻覺的辦法”,但也承認,“即使是最先進的AI模型也容易生成謊言,它們在不确定的時刻會表現出捏造事實的傾向。”
總部位于紐約的人工智能初創公司和機器學習監控平台Arthur AI也在2023年8月釋出研究報告,比較了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司開發的大語言模型出現幻覺的機率。研究報告顯示,這些大模型都會産生幻覺。
目前國内大語言模型雖無産生AI幻覺相關披露,但也可從相關公開報道中找到端倪。
2023年9月,騰訊混元大語言模型正式亮相。騰訊集團副總裁蔣傑介紹,針對大模型容易“胡言亂語”的問題,騰訊優化了預訓練算法及政策,讓混元大模型出現幻覺的機率比主流開源大模型降低了30%—50%。
“大模型有可能‘一本正經地胡說八道’。如果不和行業專業資料庫或者一些專業應用插件進行對接,這可能會導緻它們提供過時或者不專業的答案。”科大訊飛研究院副院長、金融科技事業部CTO趙乾在第七屆金融科技與金融安全峰會上曾表示,科大訊飛已經推出一些技術方案,讓大模型揚長避短。
AI幻覺源自本身
“現在不同研究工作對AI幻覺的分類各不相同。”張民介紹,總體而言,AI幻覺可以分為内在幻覺和外在幻覺兩類。
據悉,内在幻覺即是同輸入資訊不一緻的幻覺内容,包括同使用者輸入的問題或指令不一緻,或是同對話曆史上下文資訊相沖突,如AI模型會在同一個對話過程中,針對使用者同一個問題的不同提問方式,給出自相沖突的回複。外在幻覺則是同世界知識不一緻或是通過已有資訊無法驗證的内容,例如AI模型針對使用者提出的事實性問題給出錯誤回答,或編造無法驗證的内容。
騰訊AI Lab聯合國内外多家學術機構曾釋出一篇面向大模型幻覺工作的綜述。該綜述認為,AI幻覺集中在大模型缺乏相關知識、記憶錯誤知識、大模型無法準确估計自身能力邊界等場景。
“從技術原理上看,AI幻覺多由于AI對知識的記憶不足、了解能力不足、訓練方式固有的弊端及模型本身技術的局限性導緻。”張民坦言,AI幻覺會造成知識偏見與誤解,甚至有時會導緻安全風險、倫理和道德問題。
AI幻覺尚難消除
盡管AI幻覺短期内難以完全消除,但業界正試圖通過技術改進和監管評估來緩解其影響,以保障人工智能技術的安全可靠應用。
“現階段AI幻覺難以完全被消除,但卻可以試着緩解。”張民介紹,在預訓練、微調強化學習、推理生成等階段中運用适當的技術手段,有望緩解AI幻覺現象。
據介紹,在預訓練方面,需增加知識密集的資料、高品質資料的選取和過濾;微調強化學習過程中,選擇模型知識邊界内的訓練資料極為重要;推理生成過程中,可以采用檢索外部知識的辦法使得模型生成結果有證據可循。此外,改進解碼搜尋算法也是一種可行的方案。
騰訊AI Lab聯合國内外多家學術機構釋出的綜述亦表明了同樣觀點,并認為諸如多智能體互動、指令設計、人在回路、分析模型内部狀态等技術也可成為緩解AI幻覺的方式。
值得一提的是,哈爾濱工業大學(深圳)自研的立知文本大模型和九天多模态大模型,對于上述緩解AI幻覺的方式均有深入探索,并取得了顯著效果。
“這對于開發一個真實可信的AI大模型是十分有必要的。”張民介紹,“我們嘗試通過視覺資訊增強語言模型的能力,降低語言模型的外部幻覺問題;通過多個大模型智能體進行獨立思考和分析,經由多智能體之間的讨論、博弈和合作,增強回複的客觀性,減少AI幻覺。”
張民表示,破解AI幻覺将提高AI系統的實用性、可信度和可應用性,這對人工智能技術的未來發展和社會的發展都有積極影響。同時,更可靠的AI系統可以更廣泛地應用于各個領域,這将促進技術進步的速度,帶來更多的創新。未來,破解AI幻覺需要進一步在算法、資料、透明度和監管等多個方面采取措施,以確定AI系統的決策更加準确可靠。
/ 福利大放送,答題領紅包 /
通知通知!新一輪紅包活動開始啦!
每天12:00-24:00!
來源:科技日報,原标題:《AI為何會“一本正經地胡說八道”》
記者:羅雲鵬
圖檔來源:圖蟲創意
本文封面圖及配圖來自版權圖庫,不授權轉載