ChatGPT取得了巨大的成功，在短短一個月内就獲得了1億使用者，并激發了企業和專業人士對如何在他們的組織中利用這一工具的興趣和好奇心。

但LLM究竟是什麼，它們如何使你的企業受益?它隻是一種炒作，還是會長期存在?

在這篇文章中我們将讨論上面這個問題并嘗試解答為什麼LLM對企業來說是一項偉大的投資，或者不是。是大炮打蚊子還是物盡其用？這就要看何時以及如何有效和高效地使用這個大模型了。

訓練

LLM的訓練是非常昂貴……但是這并不意味着每次要使用LLM完成特定任務時都要訓練它，也不意味着你根本就不需要訓練它。有很多方法可以利用LLM的現有知識和技能，無需從頭開始訓練。

LLM能夠根據單詞和短語互相跟随的機率生成文本。也可以通過讓它“根據上下文閱讀”來“模仿”這種行為。這就好比給某人一本書，然後讓他們在書中找到他們認為可能有X問題答案的那一章。一旦讀者找到這一章，他們就會閱讀，然後試圖向你解釋他們剛剛讀到的内容。

這需要某種程度上對他進行提示，這也就是我們常說的prompt。網上有很多關于關于提示教程，提示工程以及如何為LLM生成良好的提示。是以當你試圖得到上下文答案時，LLM可以很好的工作。但不要指望機器知道一切，因為它們擅長的是放置文字，而不是闡述事實。

隻有當你想讓機器像專業人士一樣說話時，你才需要重新訓練它。

業務專業術語

所有組織和企業都有自己的行話和特定于其領域的技術術語。例如，Jam可以指甜甜的Smucker草莓果凍，但也可以指非正式播放的音樂。

這意味着不是每個人都能很容易地了解特定業務使用的語言，除非他們熟悉其詞彙和概念。是以對于不熟悉該領域的潛在客戶或合作夥伴來說可能是一個障礙。使用llm可以将技術語言翻譯成更自然和可通路的語言。

LLM可以根據所需的風格和細節水準，使用提更簡單的單詞或示例來幫助解釋複雜術語或概念的含義，這可以使資訊對任何人都更具吸引力和可了解性。

知識圖譜是在圖結構中組織資訊的一種方式，其中實體及其關系表示為節點和邊。這使得存儲和通路資訊比使用傳統文本格式更容易。知識圖譜可以獨立于任何大型語言模型(llm)建構，并且知識圖譜也可以從llm的功能中受益。

要建立知識圖譜，需要從資料源(如pdf)中提取實體和關系，并将它們插入圖資料庫中。llm可以幫助完成這項任務，通過生成代碼将資料插入到資料庫中。

llm還可以幫助使用自然語言查詢知識圖譜，以簡單易懂的方式解釋結果。通過這種方式，使用者可以使用文本與資料進行互動，并從知識圖中獲得事實和相關的答案。

LLM可以從提供的上下文中使用更簡單的單詞或示例來幫助解釋複雜術語或概念的含義

敏感資料

還記得三星的問題吧，工程師的一些機密源代碼被意外上傳到ChatGPT，

你一直覺得，這種風險僅适用于使用OpenAI網站上的免費ChatGPT界面。其實任何被稱為“免費”的東西都可能以某種方式獲得投資回報。比如使用你的資訊來改進模型。一個稍微好一些的選擇是通過API使用付費LLM服務，該服務不會使用任何敏感資料進行再訓練。

顯示現在就好很多了，有許多替代ChatGPT的方法。比如Falcon、Llama、Palm或其他性能與ChatGPT相似甚至更好的模型。我們還可以根據自己的具體需求定制自己的模型或解決方案。

通過托管自己的LLM，可以確定它僅用于預期目的，并且可以在将來需要時對其進行重新訓練。還可以探索通過使用這些模型生成的資料，以改進您的業務。例如，檢視向模型提出的最重要的問題，可以建立更好的業務解決方案并從中獲利。

有了開源的基礎模型，我們可以搭建自己的LLM，并且随時調整訓練。

部分還是全部

這裡我們以推薦系統為例：

推薦系統是一種基于某些标準推薦項目或操作的系統。例如，Spotify使用你的收聽曆史和偏好來為你建立個性化的播放清單。你可以把它想象成根據其他人的喜好推薦音樂，這可能與你的喜好相比對。

LLM也可以做到這一點，通過嵌入來衡量兩個資訊片段之間的相似性或差異性，比如一個問題和一個答案。但是如果我們隻把LLM簡化到這個程度（隻生成嵌入），那麼推薦系統不是要更簡單嗎，而且推薦系統能夠得到更準确的結果，需要的資源還更少。

那我們為什麼要用LLM來做這個呢？

找到對任何給定問題的最準确的回答，然後解釋為什麼它是一個好的比對，這是推薦引擎無法做到的。嵌入不僅可以對文本做同樣的事情，還可以對任何來源做同樣的事情;從音頻到圖像。推薦系統需要額外的元件來處理和标記這些類型的資訊。

是以這是一種種特殊情況，我們的推薦需要音頻你和圖像嗎？是以在使用前需要評估要解決的問題否需要LLM所能提供的所有功能，或者是否可以用更傳統的方式解決問題。（其實上面的音頻和圖像隻要增加幾個模型就可以了，投入遠遠要比使用LLM低很多）

如果隻用了LLM的一少部分功能，那麼肯定有比他更好的更傳統的解決方案

總結

LLM不僅僅是一種炒作，它們其實是一種強大而通用的技術，可以實作業務目标并提高客戶滿意度。但是LLM并不是靈丹妙藥，使用時尤其需要需要仔細規劃、評估和優化，以確定其有效性和效率。

如果你打算以正确的方式将llm整合到業務中，記住:

專業的人做專業的事

是否在業務中使用大語言模型？

訓練

業務專業術語

敏感資料

部分還是全部

總結

繼續閱讀

大語言模型部署：vLLM 與量化技術

蘋果發高效語言模型 OpenELM；小米策劃 15 萬元新車；AI 成功改寫人類 DNA|極客早知道

深度學習與化學語言模型結合，用于藥物從頭設計，登Nature子刊

屬于各大科技公司的風口又來了！這次大語言模型引領“新工業革命

大語言模型落地為什麼第一步是做客服

OpenAI推出全新大語言模型GPT-4o；蘋果将在中國開售Vision Pro；軟銀幾乎全部出售阿裡股份

探索大語言模型：了解Self Attention| 京東物流技術團隊

知識圖與大型語言模型的協同作用

多功能RNA分析，百度團隊的RNA語言模型登Nature子刊

參數少量提升，性能指數爆發！谷歌：大語言模型暗藏神秘技能

深入了解大語言模型運維(LLMOps)

#頭條創作挑戰賽#Gai是現在人工智能追求的目标,也是現在人工智能的本質，知識庫的建立,不能像行業知識庫一樣，一個行業就

CVPR 2024｜讓圖像擴散模型生成高品質360度場景，隻需要一個語言模型

奧特曼談AI的機遇、挑戰與人類自我反思：中國将擁有獨特的大語言模型

2024 年 19 種最佳大型語言模型

如何讓小型語言模型高效工作？