第29期 最新AI大模型开源项目
❶项目名称:NewHope
★开源实现代码/模型权重
★面向编程的llama-2-13b微调语言模型,提供强大的编码能力,可处理不同的语言,包括Python、C++、Java、JavaScript、Go等
★HumanEval初步评估显示NewHope拥有GPT-4 99%的编程能力
# llama2微调编程模型
❷项目名称:text-generation-inference
★开源实现代码
★用于文本生成推理的Rust、Python和gRPC服务器,在HuggingFace的生产环境中为Hugging Chat、Inference API和Inference Endpoint提供支持
★通过简单的启动器来提供主流大型语言模型,并利用张量并行技术在多个GPU上实现更快的推理
# huggingface官方文本生成推理库
❸项目名称:Megatron-LLM
★开源实现代码
★支持大规模分布式语言模型(LLM)预训练和微调的库,支持在多个节点上的商用硬件上训练大型模型(70B Llama2、65B Llama1 和 40B Falcon),支持分组查询注意力(GQA)和多查询注意力(MQA)
# LLM预训练微调库
❹项目名称:llama2.rs
★开源实现代码
★Llama2的Rust实现,采用llama2.c的Rust端口,仅需一行代码即可构建llama2.rs
# llama2的Rust实现
❺项目名称:Doctran
★开源实现代码
★旨在通过使用LLM和开源NLP库将原始文本转换为干净、结构化、信息密集的文档,从而优化向量空间检索
# 基于LLM的文档转换框架