華為釋出會翻車?官方回應大模型被指造假:不存在人工操控
騰訊新聞深網
2024-05-16 16:03釋出于河北騰訊新聞《深網》欄目官方賬号
圖檔來源視覺中國
作者丨程潇熠
編輯丨虞塵
出品丨深網·騰訊新聞小滿工作室
5月16日,針對網傳華為大模型文生圖現場展示疑似人工操控的消息,華為昇騰社群回應稱:并非調取預置圖檔,本次展示的均為真實代碼,也将在昇騰社群上開放。
事情的起因是,6天前在鲲鵬昇騰開發者大會的一場面向開發者的技術讨論會上,華為示範了mxRAG SDK功能,即如何通過十幾行代碼即可完成RAG應用開發。
據網傳視訊及聊天截圖,華為在示範文生圖功能時,按下Crtl-C中斷,顯示對應代碼為time.sleep(6),有網友解釋代碼的意思是:暫停6秒,然後讀取本地的一張圖檔展示出來。
是以,華為被質疑大模型能力示範造假。
昇騰社群回應稱,現場圖檔為實時生成,調用的是開源大模型。代碼中有time.sleep(6)等表述,是指令等待讀取外部開源大模型實時生成的圖檔,并非調取預置圖檔。本次展示的均為真實代碼,也将在昇騰社群上開放,歡迎開發者使用并提出寶貴建議。
“具體什麼情況很難說,但示範場景還是可以了解的。”一位AI相關開發者告訴《AI光年》,因為目前企業很難接受真實示範場景出故障,是以“大家做demo多少都有一些作假的成分”,他猜測,華為這次示範可能存在“趕工”搶釋出熱點的情況。
《AI光年》發現,華為此次展示的mxRAG SDK功能,目前還未在開發者資源下載下傳中心上線,資源最新更新時間為4月22日。
據《AI光年》了解,mxRAG的功能為檢索增強生成——檢索(Retrieval)、增強(Augmentation)和生成(Generation)。這一能力是目前開發大語言模型(LLM)所需的重要能力之一。
據一篇香港理工大學、百度、新加坡國立大學等研究機構發表的一篇論文,LLM+RAG被應用于多個領域,包括但不限于:問答系統、聊天機器人、事實驗證、金融領域的決策支援、科學領域的分子發現等。未來還可以提高模型的可信度,開發多語言和多模态的RA-LLMs等。
由于昇騰社群暫未公布源代碼,開發者目前僅能通過網傳代碼截圖進行經驗判斷和讨論,《AI光年》發現,大部分開發者認為文生圖過程理論上“完全沒必要sleep(6)”。但具體情況如何?華為mxRAG SDK功能如何?還需資源開放後再做驗證。
檢視原圖 114K
個人觀點,僅供參考