LocalAI - 相容OpenAI API的本地大模型技術棧

作者：新缸中之腦 2023-05-15 23:23:00

LocalAI 是一個用于本地推理的與OpenAI API 規範相容的REST API，它允許使用消費級硬體在本地或本地運作模型，支援llama.cpp、alpaca.cpp、gpt4all.cpp、rwkv.cpp、whisper.cpp、vicuna、koala、gpt4all-j、cerebras 等大模型。

推薦：用 NSDT設計器快速搭建可程式設計3D場景。

OpenAI 替代性REST API
支援多種模型
第一次加載後，它會将模型加載到記憶體中以進行更快的推理
支援提示模闆
使用 C++ 綁定來實作更快的推理和更好的性能。

LocalAI 是一個社群驅動的項目，專注于讓任何人都能通路 AI。它最初是由 SpectroCloud OSS 辦公室的 mudler 建立的。

LocalAI 使用 C++ 綁定來優化速度。它基于用于音頻轉錄的 llama.cpp、gpt4all、rwkv.cpp、ggml、whisper.cpp 和用于嵌入的 bert.cpp。

1、LocalAI工作原理

2、LocalAI模型相容性

LocalAI與 llama.cpp 支援的模型相容，還支援 GPT4ALL-J 和帶有 ggml 的 cerebras-GPT。LocalAI還應該與 StableLM 和 GPTNeoX ggml 模型相容，但我們尚未測試過。

模型相容性清單如下：

3、LocalAI使用方法

LocalAI 預設作為容器鏡像出現。可以在此處檢視帶有相應标簽的所有可用鏡像。

運作 LocalAI 的最簡單方法是使用 docker-compose：

git clone https://github.com/go-skynet/LocalAI

cd LocalAI

# (optional) Checkout a specific LocalAI tag
# git checkout -b build <TAG>

# copy your models to models/
cp your-model.bin models/

# (optional) Edit the .env file to set things like context size and threads
# vim .env

# start with docker-compose
docker-compose up -d --build

# Now API is accessible at localhost:8080
curl http://localhost:8080/v1/models
# {"object":"list","data":[{"id":"your-model.bin","object":"model"}]}

curl http://localhost:8080/v1/completions -H "Content-Type: application/json" -d '{
     "model": "your-model.bin",            
     "prompt": "A long time ago in a galaxy far, far away",
     "temperature": 0.7
   }'

下面是使用 GPT4ALL-J 模型的示例：

# Clone LocalAI
git clone https://github.com/go-skynet/LocalAI

cd LocalAI

# (optional) Checkout a specific LocalAI tag
# git checkout -b build <TAG>

# Download gpt4all-j to models/
wget https://gpt4all.io/models/ggml-gpt4all-j.bin -O models/ggml-gpt4all-j

# Use a template from the examples
cp -rf prompt-templates/ggml-gpt4all-j.tmpl models/

# (optional) Edit the .env file to set things like context size and threads
# vim .env

# start with docker-compose
docker-compose up -d --build

# Now API is accessible at localhost:8080
curl http://localhost:8080/v1/models
# {"object":"list","data":[{"id":"ggml-gpt4all-j","object":"model"}]}

curl http://localhost:8080/v1/chat/completions -H "Content-Type: application/json" -d '{
     "model": "ggml-gpt4all-j",
     "messages": [{"role": "user", "content": "How are you?"}],
     "temperature": 0.9 
   }'

# {"model":"ggml-gpt4all-j","choices":[{"message":{"role":"assistant","content":"I'm doing well, thanks. How about you?"}}]}

原文連結：http://www.bimant.com/blog/localai/

LocalAI - 相容OpenAI API的本地大模型技術棧

1、LocalAI工作原理

2、LocalAI模型相容性

3、LocalAI使用方法

繼續閱讀

ChatGPTAndroid版來啦！期待已久！！！來自官方的APP上架GooglePlay，并直接開放預注冊，上架自動安

OpenAI 推出适用于 Android 的官方 ChatGPT 應用程式

對話前OpenAI科學家：愛、滅亡和人工智能

OpenAI聯創Karpathy愛上羊駝:純C代碼實作嬰兒Llama2,已攬1.6k星

【安卓版ChatGPT今日全球上線！】AI奇點網7月26日報道丨來自OpenAI官方推特的消息，當地時間7月25日晚間，

準确性極低！OpenAI下架AI檢測器，ICML傑出論文被打臉

【編碼能力超越ChatGPT！揭秘華為新一代代碼大模型】AI奇點網7月30日報道丨去年7月，華為諾亞方舟實驗室旗下的語音

谷歌新AI阿法星，C位出道爆錘人類職業遊戲玩家！

【中文生成竟然比英文貴兩倍！ChatGPT處理不同語言運算成本差距極大】AI奇點網7月31日報道丨牛津大學最新的一項研究

OpenAI關閉内容檢測工具，借助密碼學，C2PA正在成為新的替代者

OpenAI假設被推翻！大模型輸小模型，Llama 2訓練與GPU計算關聯度

被黃仁勳和OpenAI接連點名，這家向量資料庫公司終迎“iPhone時刻”｜年度AI對話

java調用ChatGPT的API接口

我去，AI開花結果的時代，偏逢[我想靜靜]微軟、華為之類的神對手，谷歌硬是沒過上幾天安心的日[捂臉]子！年初的時候，Ch

Meta硬剛OpenAI，國産“小模型”官宣開源，“百模大戰”走向何方？

OpenAI 的 GPT 簡化版：函數調用