天天看點

Cleanlab推出新方案檢測人工智能幻覺

作者:AI時代前沿

Cleanlab推出了可信賴語言模型(TLM:Trustworthy Language Model),這是生成式人工智能的一個根本性進步。該公司表示,它可以檢測到大型語言模型(LLM)何時出現幻覺。伯克利研究小組副主任兼進階資料科學家Steven Gawthorpe博士稱,可信語言模型是“我所見過的對LLM幻覺的第一個可行答案”。

Cleanlab推出新方案檢測人工智能幻覺

生成式人工智能(GenAI)有望改變每一個行業和職業,但它面臨着“幻覺”的重大挑戰,LLM會産生不正确或誤導性的結果。LLM給出的回應可能看上去令人信服。但這是正确的嗎?它是基于現實嗎?LLM沒有辦法确定。這使得用GenAI自動執行敏感任務幾乎是不可能的。

缺乏信任是企業采用LLM的主要障礙。數十億美元的生産力收益被阻擋在這種困境背後。Cleanlab可能是第一個破解它的公司。

Cleanlab的TLM結合了世界一流的不确定性估計、自動ML內建和量子資訊算法,這些算法被重新用于通用計算,以增加對生成式人工智能的信任。它的API可以封裝任何LLM,為每個響應生成可靠的可信度評分。

在LLM可靠性的行業标準基準測試中,TLM全面優于其他方法。它提供的性能不僅優越,而且始終保持優越,讓企業有信心依靠生成式人工智能來完成重要的工作。

例如,企業可以使用TLM自動化客戶退款流程,當LLM的響應低于預定的可信度水準時,就會引入人工稽核人員。

Cleanlab推出新方案檢測人工智能幻覺

“Cleanlab的TLM為我們提供了數千名資料科學家的豐富資料和加強LLM輸出的能力,為我們的許多客戶提供了10倍到100倍的投資回報率。與Cleanlab所做的相比,其他工具甚至不在同一競争水準。”Gawthorpe說。

“Cleanlab的TLM是一個真正開創性的解決方案,可以有效地解決幻覺。”Lightning.ai的人工智能工程師Akshay Pachaar補充道。“內建了Cleanlab的可信度評分,改變了人工循環工作流程,實作了高達90%的自動化。它不僅每周節省數百小時的人力,而且提高了我們處理大量資料集的效率,以進行資料充實、檔案和聊天日志分析以及其他大規模任務。它有可能徹底改變我們管理資料和從資料中擷取價值的方式。”

除了使LLM更值得信賴之外,TLM也使LLM更準确。它的功能就像一種超級LLM,檢查LLM的輸出,以提供比LLM自己更好的結果。在比較GPT4和GPT4 + TLM的準确率的基準測試中,GPT4和TLM的組合每次都優于GPT4本身。這使得TLM非常适合以下場景:

RAG(檢索增強生成):為LLM提供更可靠的上下文;

商業聊天機器人:準确回答客戶和員工的問題;

資料提取:從pdf中提取複雜資訊;

證券分析:掃描股票評論,尋找最強的買入信号。

與Cleanlab的其他産品一樣,TLM源于創始人對人工智能資料集不确定性的開創性研究。該公司首席執行官Curtis Northcutt花了八年時間與量子計算機的發明者合作,了解如何從任意資料中提取可靠的計算。其首席科學家Jonas Mueller上司了AutoGluon的開發,這是AWS的開源和行業标準Auto-ML平台。其首席技術官Anish Athlaye是世界上最著名的機器學習開發人員之一,他的個人項目在GitHub上擁有超過30,000顆星。

亞馬遜網絡(AWS)、谷歌(Google)、摩根大通(JPMorgan Chase)、特斯拉(Tesla)和沃爾瑪(Walmart)等财富500強企業都在使用Cleanlab的技術來改進資料輸入。現在,Cleanlab正在将同樣的專業知識應用于LLM的産出——其經濟意義甚至更大。

Cleanlab首席執行官Curtis Northcutt表示:“這是企業生成式人工智能的一個轉折點。““增加對LLM的信任,将改變人們對LLM使用的考量。我們總會有某種形式的幻覺。不同的是,現在我們有一個強大的解決方案來檢測和管理它們。這意味着企業可以為以前無法想象的用例部署生成式人工智能,并解鎖重要的新生産力和收入來源。”

Cleanlab推出新方案檢測人工智能幻覺

Cleanlab由三位麻省理工學院計算機科學博士于2021年創立,通過将不可靠的資料轉化為可靠的模型和見解,為資料驅動過程的每一個輸入和輸出增加了信任。Cleanlab的人工智能資料平台Cleanlab Studio可以自動發現和修複結構化和非結構化資料集中的錯誤,如視覺、文本和表格資料,并為資料點添加30多個品質/信任分數。它的可信語言模型(TLM)提供了第一種可靠的方法來評估LLM輸出的可信度。

Cleanlab總部位于舊金山,作為福布斯人工智能50強公司之一,得到了Menlo Ventures、Bain Capital Ventures、Databricks Ventures、TQ Ventures、Samsung Ventures等領先投資者的支援,以及包括雅虎、GitHub、Mosaic和Okta等公司首席執行官和創始人在内的天使投資人的支援。

繼續閱讀