Vectara使用RAG解決LLM謊言和香農定理限制

Vectara首席執行官Amr Awadallah表示，由于設計方式和香農資訊定理(Shannon Information Theorem)關于資料壓縮的基本限制，大型語言模型(LLM)會産生幻覺。但也有解決LLM幻覺問題的方法，包括Vectara使用檢索增強生成(RAG)等方法。

麻省理工學院教授克勞德·香農(Claude Shannon)于2001年去世，他因在數學、計算機科學、電子工程和密碼學領域的廣泛貢獻而被稱為資訊論之父。他在其開創性論文《通信的數學理論》(通常被稱為“資訊時代的大憲章”)中發表的一項觀察稱，在資料開始失去意義之前，可以壓縮多少資料是有内在限制的。

Awadallah解釋道:“香農資訊定理毫無疑問地證明了你可以壓縮文本的最大值是12.5%。如果壓縮超過12.5%，那麼你現在就處于所謂的有損壓縮區，而不是無損壓縮區。”

資訊論之父，麻省理工學院教授克勞德·香農

問題是，LLM用于訓練的資料壓縮遠遠超過了12.5%，這導緻LLM進入有損壓縮區，是以容易出現錯誤和幻覺。Awadallah說:“簡而言之，它們産生幻覺是因為我們把資料壓縮得太多了。”

今天的一些LLM需要大約1萬億個單詞，并将其塞進一個有10億個參數的空間，這代表了1000倍的壓縮率。他說，像GPT-4這樣的一些工具做得更好，壓縮率約為100倍。

Awadallah說，減少幻覺的一個簡單方法就是将更少的資料塞進LLM中——在更小的資料集上有效地訓練LLM——并使壓縮率高于文本所需的12.5%。

但如果我們那樣做了，LLM就沒那麼有用了。他說，這是因為我們不是在訓練LLM們完美地回憶資訊，而是在訓練他們了解詞彙所反映的潛在概念。

這位Cloudera的聯合創始人說，這有點像教育實體學家。作為一名大學生，學生接觸到科學公式，但他沒有被無休止地死記硬背。實體學家教育中最重要的部分是掌握實體世界的關鍵概念。在測試中，實體學生可以打開課本來學習科學公式，因為實體老師明白，即使學生在展示對關鍵實體概念的了解時，偶爾也會忘記一個公式。

Awadallah說，開卷考試，而不是要求完美記憶，是解決LLM幻覺的部分方法。使用RAG技術實作的開卷測試為LLM帶來了額外的資料，提供了一種檢查LLM是否傾向于編造内容的方法。

他說:“簡單說，RAG就是一本打開的書。我們告訴(LLM)，‘你們現在的工作是回答這個問題，但隻能使用這些事實。’”

Vectara的大語言模型幻覺排行榜(圖檔來自Vectara)

Vectara的從業人員希望這種“沙盒”技術足以将幻覺率降至零。他們很快了解到，雖然它在一定程度上降低了幻覺率，但并沒有完全消除幻覺。例如，使用Vectara的RAG，GPT-4的幻覺率下降到3%，這有所改善，但仍不足以用于生産。根據Vectara的幻覺排行榜，Llama- 270b的幻覺率為5.1%，而谷歌Palm的幻覺率約為12%。

Awadallah說：“雖然所有這些事實都是正确的、未經壓縮的、高度(相關)的事實，但它們仍然可以虛構一些東西。”

消除剩餘的幻覺需要另一種技術：創造一種專門用于檢測幻覺的新型LLM。

與人類事實核查員一樣，被稱為“回旋镖”(Boomerang)的Vectara LLM會生成一個分數，該分數與LLM的答案被捏造的可能性相對應。

Boomerang比GPT-4本身更擅長事實核查的一個原因是，它是專門為事實核查而設計的LLM。另一個原因是，它是根據公司自己的資料進行訓練的。客戶可以定義模型用來确定真實性的事實。然後，這些資料被存儲在Vectara解決方案的另一個元件中：一個自制的矢量資料庫。

Awadallah說:“矢量資料庫所做的是存儲你的原始内容——你擁有的文本——但它也存儲内容背後的含義，作為矢量嵌入。我們會根據你所處的環境，以及你在一個經營企業的組織中所擁有的東西，為你提供非常專業的服務。”

Vectra的完整解決方案僅在雲中運作，包括Boomerang、“盒子裡的RAG”和一個運作在LLM旁邊的矢量資料庫。任何非結構化文本，從word文檔和pdf到基于紙張的檔案，都可以通過光學字元識别(OCR)作為訓練模型的輸入。

Vectara讓客戶可以選擇使用GPT-4或Mistral 7B，作為托管服務運作在雲中，也可以運作在客戶自己的VPC中。

客戶選擇哪個LLM取決于他們想做什麼，以及他們向OpenAI發送資料的适配程度。

“Mistral 7B是目前世界上最好的模型之一。它的體積很小，是以速度非常快，而且平均表現非常好。” Awadallah說，“我們自己為客戶提供這種模型。或者如果他們想讓我們調用GPT-4，我們也可以調用GPT-4。”他說，Meta的Llama-2将在未來加入。

在ChatGPT引發人工智能熱潮之前，Awadallah于2020年創立了Vectara，該公司的目标是讓企業能夠建立自己的聊天機器人和會話界面。Awadallah承認，有數百家初創公司和成熟的科技公司在追逐這個資訊金礦，但他堅持認為，Vectara已經建立了一個解決方案，解決了人們對幻覺的擔憂，以及其他一些問題，比如防禦即時注入攻擊，這在某種程度上使公司走在了前沿。

Awadallah表示，自從去年4月推出GA産品以來，Vectara已經收到了1.8萬名注冊使用者，這一數字以每周500至700人的速度增長。在使用Vectara的公司中，有一家超音波制造商希望根據專家最佳實踐的提煉實作機器配置的自動化，還有一家财富咨詢公司希望提供無幻覺的金融建議。

Awadallah說，雖然高管們正在窺視GenAI革命帶來的利益，但它也給像Vectara這樣的公司帶來了阻力。

他表示:“我認為ChatGPT幫助很大，但它讓企業躊躇不前。”“當他們看到這些幻覺時，他們不确定自己能不能用這個。如今，在市場上看到了解決方案，他們可以真正控制這種幻覺。”

Vectara使用RAG解決LLM謊言和香農定理限制

繼續閱讀

兩舅舅有沖突七年，春節拜年我用謊言令二人握手言和，母親笑了

周鴻祎再見馬化騰，兩人握手言和，馬化騰調侃：你是大網紅了

與獨處相安，與萬事言和

相信一切都會真相大白——如何應對資訊時代的謠言和虛假資訊？

伊朗總統親自登門，與巴鐵握手言和，中巴走廊和波斯灣連成一條線

吳謹言真是藏得夠深！真是沒想到，吳謹言和李純居然還有這層關系，緣分也真是妙不可言，魏璎珞和魏嬿婉前後都演過令妃，看學生時

朱之文爆紅之後的煩惱：于文華坦言和朱之文是姐弟關系

哈馬斯和法塔赫，要在中國握手言和，訪華的布林肯，或要見證曆史

七大謊言和真相，看完漲知識了

世錦賽八強戰遇阻！利索夫斯基與奧康納露出原形！希金斯握手言和

心理學家：那些你經常說的話，可能會成為你的生命預言和命運！

莫言和餘華的微信頭像…全網跟着笑瘋！熱搜都快爆了！哈哈哈哈哈

握手言和，拜仁2-2皇馬，維尼修斯2球、凱恩破門，次回合懸念大

千萬網紅夫妻結束12年婚姻，朱莉坦言和阿福沒有“狗血劇情”

女兒離家前發誓言和父母斷絕關系，8年後帶女兒回家：沒臉見你們