天天看点

ChatGPT带火了大语言模型(LLM:LargeLanguageModel),通常是由互联网上的海量文本语料数据训练得

作者:微说互联网

ChatGPT带火了大语言模型(LLM:Large Language Model),通常是由互联网上的海量文本语料数据训练得到的,包括互联网新闻、博客、维基百科等。除了OpenAI的GPT和Google的BERT以外,Meta也推出了LLaMA(Large Language Model Meta AI)大型语言模型,并且是完全开放的。

Meta的LLaMA模型包括 70 亿、130 亿、330 亿、650 亿 4 种参数规模,LLaMA 也是一个建立在 Transformer 基础架构上的自回归语言模型(Autoregression Language Model)。LLaMA 130 亿参数版本的表现,据说在大多数测试上优于 OPT 和 GPT-3 1750 亿参数版,ChatGPT也终于遇到了对手。

ChatGPT带火了大语言模型(LLM:LargeLanguageModel),通常是由互联网上的海量文本语料数据训练得
ChatGPT带火了大语言模型(LLM:LargeLanguageModel),通常是由互联网上的海量文本语料数据训练得
ChatGPT带火了大语言模型(LLM:LargeLanguageModel),通常是由互联网上的海量文本语料数据训练得

继续阅读