赞
踩
OpenAI发布的ChatGPT火爆全球以来,全球互联网大厂陆续跟进,纷纷宣布了自家的Chat产品,如Google的Bard,百度的文心一言,阿里的通义千问等等。
这些Chat产品背后都是依赖的大语言模型(Large Language Model)。
如果是做一个垂直领域的Chat产品,有2种方案:
本文重点介绍有较大参考价值的开源大语言模型,方便大家快速找到适合自己应用场景的开源模型。
Model | 作者 | 参数量 | 训练数据量(tokens) | 训练成本 |
---|---|---|---|---|
LLaMA | Meta | 包括 70 亿、130 亿、330 亿、650 亿 4 种参数规模 | 1.4万亿 | 2048个A100 GPU |
Alpaca | Stanford | 70亿 | 52k条问答指令数据,指令数据来源于OpenAI的API返回结果 | 500美元数据成本+100美元训练成本 |
Vicuna | UC Berkeley, CMU, Stanford, UCSD and MBZUAI | 130亿 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。