天天看點

是否在業務中使用大語言模型?

作者:deephub

ChatGPT取得了巨大的成功,在短短一個月内就獲得了1億使用者,并激發了企業和專業人士對如何在他們的組織中利用這一工具的興趣和好奇心。

但LLM究竟是什麼,它們如何使你的企業受益?它隻是一種炒作,還是會長期存在?

在這篇文章中我們将讨論上面這個問題并嘗試解答為什麼LLM對企業來說是一項偉大的投資,或者不是。是大炮打蚊子 還是 物盡其用?這就要看何時以及如何有效和高效地使用這個大模型了。

是否在業務中使用大語言模型?

訓練

LLM的訓練是非常昂貴……但是這并不意味着每次要使用LLM完成特定任務時都要訓練它,也不意味着你根本就不需要訓練它。有很多方法可以利用LLM的現有知識和技能,無需從頭開始訓練。

LLM能夠根據單詞和短語互相跟随的機率生成文本。也可以通過讓它“根據上下文閱讀”來“模仿”這種行為。這就好比給某人一本書,然後讓他們在書中找到他們認為可能有X問題答案的那一章。一旦讀者找到這一章,他們就會閱讀,然後試圖向你解釋他們剛剛讀到的内容。

這需要某種程度上對他進行提示,這也就是我們常說的prompt。網上有很多關于關于提示教程,提示工程以及如何為LLM生成良好的提示。是以當你試圖得到上下文答案時,LLM可以很好的工作。但不要指望機器知道一切,因為它們擅長的是放置文字,而不是闡述事實。

隻有當你想讓機器像專業人士一樣說話時,你才需要重新訓練它。

業務專業術語

所有組織和企業都有自己的行話和特定于其領域的技術術語。例如,Jam可以指甜甜的Smucker草莓果凍,但也可以指非正式播放的音樂。

這意味着不是每個人都能很容易地了解特定業務使用的語言,除非他們熟悉其詞彙和概念。是以對于不熟悉該領域的潛在客戶或合作夥伴來說可能是一個障礙。使用llm可以将技術語言翻譯成更自然和可通路的語言。

LLM可以根據所需的風格和細節水準,使用提更簡單的單詞或示例來幫助解釋複雜術語或概念的含義,這可以使資訊對任何人都更具吸引力和可了解性。

知識圖譜是在圖結構中組織資訊的一種方式,其中實體及其關系表示為節點和邊。這使得存儲和通路資訊比使用傳統文本格式更容易。知識圖譜可以獨立于任何大型語言模型(llm)建構,并且知識圖譜也可以從llm的功能中受益。

是否在業務中使用大語言模型?

要建立知識圖譜,需要從資料源(如pdf)中提取實體和關系,并将它們插入圖資料庫中。llm可以幫助完成這項任務,通過生成代碼将資料插入到資料庫中。

是否在業務中使用大語言模型?

llm還可以幫助使用自然語言查詢知識圖譜,以簡單易懂的方式解釋結果。通過這種方式,使用者可以使用文本與資料進行互動,并從知識圖中獲得事實和相關的答案。

LLM可以從提供的上下文中使用更簡單的單詞或示例來幫助解釋複雜術語或概念的含義

敏感資料

還記得三星的問題吧,工程師的一些機密源代碼被意外上傳到ChatGPT,

你一直覺得,這種風險僅适用于使用OpenAI網站上的免費ChatGPT界面。其實任何被稱為“免費”的東西都可能以某種方式獲得投資回報。比如使用你的資訊來改進模型。一個稍微好一些的選擇是通過API使用付費LLM服務,該服務不會使用任何敏感資料進行再訓練。

顯示現在就好很多了,有許多替代ChatGPT的方法。比如Falcon、Llama、Palm或其他性能與ChatGPT相似甚至更好的模型。我們還可以根據自己的具體需求定制自己的模型或解決方案。

是否在業務中使用大語言模型?

通過托管自己的LLM,可以確定它僅用于預期目的,并且可以在将來需要時對其進行重新訓練。還可以探索通過使用這些模型生成的資料,以改進您的業務。例如,檢視向模型提出的最重要的問題,可以建立更好的業務解決方案并從中獲利。

有了開源的基礎模型,我們可以搭建自己的LLM,并且随時調整訓練。

部分還是全部

這裡我們以推薦系統為例:

推薦系統是一種基于某些标準推薦項目或操作的系統。例如,Spotify使用你的收聽曆史和偏好來為你建立個性化的播放清單。你可以把它想象成根據其他人的喜好推薦音樂,這可能與你的喜好相比對。

LLM也可以做到這一點,通過嵌入來衡量兩個資訊片段之間的相似性或差異性,比如一個問題和一個答案。但是如果我們隻把LLM簡化到這個程度(隻生成嵌入),那麼推薦系統不是要更簡單嗎,而且推薦系統能夠得到更準确的結果,需要的資源還更少。

那我們為什麼要用LLM來做這個呢?

找到對任何給定問題的最準确的回答,然後解釋為什麼它是一個好的比對,這是推薦引擎無法做到的。嵌入不僅可以對文本做同樣的事情,還可以對任何來源做同樣的事情;從音頻到圖像。推薦系統需要額外的元件來處理和标記這些類型的資訊。

是以這是一種種特殊情況,我們的推薦需要音頻你和圖像嗎?是以在使用前需要評估要解決的問題否需要LLM所能提供的所有功能,或者是否可以用更傳統的方式解決問題。(其實上面的音頻和圖像隻要增加幾個模型就可以了,投入遠遠要比使用LLM低很多)

如果隻用了LLM的一少部分功能,那麼肯定有比他更好的更傳統的解決方案

總結

LLM不僅僅是一種炒作,它們其實是一種強大而通用的技術,可以實作業務目标并提高客戶滿意度。但是LLM并不是靈丹妙藥,使用時尤其需要需要仔細規劃、評估和優化,以確定其有效性和效率。

如果你打算以正确的方式将llm整合到業務中,記住:

專業的人做專業的事

繼續閱讀