大型語言模型訓練：投資巨大，小公司如何應對？

作者：飛熊入夢NO1 2023-04-10 10:11:00

近來，大型語言模型（Large Language Model）在自然語言處理領域中的應用越來越廣泛。然而，訓練這些模型需要巨大的投入，對于小型企業來說可能是一筆難以承受的成本。

近日，華為高管公布的資料顯示，AI大模型開發和訓練一次的成本高達1200萬美元。然而，人工智能發展已從局部探索走向千行百業，AI走進企業核心生産系統，開始創造更大價值。據預測，人工智能行業滲透率提速，2026年将達到20%。那麼針對大型語言模型巨額訓練投入，小型企業如何應對如何面對？以下是一些建議。

1.選擇合适的模型

對于小型企業來說，選擇合适的模型非常重要。雖然GPT-3等大型語言模型在性能方面有着很大的優勢，但對于小型企業來說，其訓練成本過高。是以，選擇一些規模較小的模型，如GPT-2等，可以在不犧牲性能的情況下，降低訓練成本。

2.合理利用預訓練模型

現在有許多已經訓練好的預訓練模型可以使用，比如BERT、RoBERTa等。對于小型企業來說，可以選擇這些已經訓練好的模型，在此基礎上進行微調，進而達到更好的效果。這種方法可以大大降低訓練成本。

3.利用雲計算

雲計算可以為小型企業提供大量的計算資源。小型企業可以選擇将訓練任務送出到雲平台，比如AWS、Azure等，這樣可以利用雲平台的計算資源，進而降低訓練成本。

4.利用開源工具

現在有許多優秀的開源工具可以幫助小型企業降低訓練成本，比如Hugging Face的Transformers、PyTorch等。這些工具提供了許多已經訓練好的模型以及相關的訓練代碼，使得小型企業可以快速地開始訓練模型，并且能夠更加高效地利用計算資源。

5.尋求合作夥伴

小型企業可以考慮尋求合作夥伴，共同分擔訓練成本。比如，可以與同行業的公司或者研究機構合作，共同投資進行模型訓練，然後分攤成本。這種方式可以讓小型企業在訓練大型語言模型時，減輕經濟壓力，同時也能夠更好地利用各自的技術和資源。

總之，大型語言模型的訓練投入巨大，對于小型企業來說是一大挑戰。但是，小型企業可以通過選擇合适的模型、合理利用預訓練模型、利用雲計算、利用開源工具、尋求合作夥伴等方式來降低訓練成本，并且在這個過程中，能夠更好地利用各自的技術和資源，進而取得更好的效果。

大型語言模型訓練：投資巨大，小公司如何應對？

繼續閱讀

【360智腦App現已登陸蘋果AppStore】AI奇點網7月24日報道丨360公司旗下AI大語言模型的移動端應用産品”

未來人工智領域必将會成為國際競争的重點，那麼大模型的訓練就成為重點了，如果基座模型和基礎都來自國外平台，那麼資訊洩露幾乎

華為雲釋出自動駕駛開發平台，科技感比YY星耀版還強？日前，華為雲公有雲業務部總裁高江海在釋出會上宣布，華為雲自動駕駛開發

AI基礎：一文看懂BERT

蜜度智能校對服務全新更新！蜜度文修大語言模型能力已在校對通産品功能中落地運作，将大資料與大模型的優勢充分疊加，并實作應用

基于BERT的新聞文本分類

制作一個有趣的QQ機器人QQ機器人簡介機器人制作方法結尾

【論文筆記】Accelerated Training for Massive Classification via Dynamic Class Selection

【YOLO】使用VOC資料集訓練自己的YOLOv3模型（Keras/TensorFlow）0. 前期準備（因人而異）1. 試驗官方模型2. 制作VOC資料集3. YOLO模型訓練4. 模型驗證5. 常見問題

DevOps 是否已死？AI 和大語言模型給雲計算和 DevOps 帶來了哪些影響

yolov3 訓練及資料集準備【記錄】yolov3 訓練及資料集準備【記錄】

關注數字技術大國競争！在人工智能這塊制高點上，決勝的關鍵在于這個要素。但很遺憾，目前美國這個資料是中國的2.6倍！大國産

大語言模型(LLMs)的相關理論分析、應用、更新疊代進展

在大語言模型時代，AI Chatbots下一步将走向何方？

詞向量與Embedding究竟是怎麼回事？

機器是如何學會說話的？大型語言模型揭秘之旅！