第29期 最新AI大模型開源項目
❶項目名稱:NewHope
★開源實作代碼/模型權重
★面向程式設計的llama-2-13b微調語言模型,提供強大的編碼能力,可處理不同的語言,包括Python、C++、Java、JavaScript、Go等
★HumanEval初步評估顯示NewHope擁有GPT-4 99%的程式設計能力
# llama2微調程式設計模型
❷項目名稱:text-generation-inference
★開源實作代碼
★用于文本生成推理的Rust、Python和gRPC伺服器,在HuggingFace的生産環境中為Hugging Chat、Inference API和Inference Endpoint提供支援
★通過簡單的啟動器來提供主流大型語言模型,并利用張量并行技術在多個GPU上實作更快的推理
# huggingface官方文本生成推理庫
❸項目名稱:Megatron-LLM
★開源實作代碼
★支援大規模分布式語言模型(LLM)預訓練和微調的庫,支援在多個節點上的商用硬體上訓練大型模型(70B Llama2、65B Llama1 和 40B Falcon),支援分組查詢注意力(GQA)和多查詢注意力(MQA)
# LLM預訓練微調庫
❹項目名稱:llama2.rs
★開源實作代碼
★Llama2的Rust實作,采用llama2.c的Rust端口,僅需一行代碼即可建構llama2.rs
# llama2的Rust實作
❺項目名稱:Doctran
★開源實作代碼
★旨在通過使用LLM和開源NLP庫将原始文本轉換為幹淨、結構化、資訊密集的文檔,進而優化向量空間檢索
# 基于LLM的文檔轉換架構