Meta 发布开源且可商用的 AI 模型 LIama 2

作者：笔触狂放9 | 2024-04-01 02:14:01

踩

liama

聚焦源代码安全，网罗国内外最新资讯！

编译：代码卫士

本周二，Meta 宣布推出AI语言模型的新开源家族 LIama 2，它具有商用许可证，意味着和之前的模型不同，这些新模型可集成到商业产品中。这些新模型的规模从7个参数到700亿个参数不等，据称“超过我们所测试的多数基准上的开源聊天模型”。

Meta 公司的首席AI科学家杨立昆 (Yann LeCun) 提到，“LLM 市场格局将由此改变。LIama-v2 已可在微软 Azure 上获取，后续将在 AWS、Hugging Face 和其它提供商上发布。”

Meta 公司指出，LIama 2“预训练”模型在2万亿个令牌上进行训练且上下文窗口为4096个令牌（文字片段）。上下文窗口决定了模型可一次处理的内容长度。Meta 还提到 LIama 2 优化模型为类似于 ChatGPT 的聊天应用程序而开发，已在“超过100万个人类标注”进行训练。

虽然在性能方面，LIama 2无法与 OpenAI 的 GPT-4 相媲美，但作为开源模型它表现不俗。英伟达公司的资深AI科学家 Jim Fan 提到，“虽然在推理任务方面，70B与GPT-3.5类似，但在编码基准方面差异巨大。在多数基准上，它与 PaLM-540B 不相上下甚至更好，但仍然远远落后于 GPT-4和 PaLM-2-L。”Meta 公司在周二发布的研究论文中详述了 LIama 2 的性能、基准和构建。

2月份，Meta 发布了 LIama2 的前身 LLaMA，它也是开源版本且具有非商用许可证。虽然官方表明仅供学术界通过某些凭据使用，但不久之后有人在种子站点上泄露了 LLaMA 的权重（包含训练神经网络参数值的文件），且在AI社区大肆传播。不久之后，LLaMA 的优化变体如 Alpaca 出现，为不断增长的地下 LLM 开发提供了种子。

LIama 2 通过对商用的补贴使这一活动更加公开，尽管“在上个月，每月超过7亿活跃用户的潜在许可者”必须从 Meta 获得特殊许可才能使用它，从而使亚马逊或谷歌这样体量的巨头无法免费使用。

开源AI的强大和危险

虽然开源的 AI 模型颇受爱好者和寻求未审查聊天机器人受众的欢迎，但同时也引来争议。在支持重大开源基础模型的技术巨头和闭源一角的巨头如OpenAI、微软和谷歌等之间，Meta 显得孤单。

批评人士认为，开源的AI模型存在很多潜在风险，如合成生物学中的滥用情况或者生成垃圾邮件或错误信息。很容易想象到LIama 2 会出现其中一些风险，虽然这类使用违反Meta的使用条款。目前，如果有人通过 OpenAI 的 ChatGPT API 执行了受限操作，那么这种访问权限将被撤销。但对于开源软件而言，一旦这些权重发布，则没有要回的机会。

不过，开源AI的支持者认为，开源AI模型提倡透明性（在使透明度成立的训练数据方面）、促进经济竞争（不止将技术限制于巨头企业）、孤立言论自由（没有审查）以及使AI访问民主化（没有付费限制）。

或许是预想到对开源模型发布的潜在批评，Meta 还发布了一份简短的“支持 Meta 对当前AI的开放方式声明”指出，“我们支持对AI的开放创新方式。负责任和开放的创新使我们所有人都在AI开发流程中具有利害关系，为这类技术带来可见性、审查和信任。开放LIama 模型将使所有人受益于这一技术。”

截止到周二下午，许多管理人员和教育人员如Dropbox 公司的首席执行官 Drew Houston、Andreessen Horowitz 的合伙人 Matt Bornstein、Hugging Face 的首席技术官 Julien Chaumond、MIT的研发科学家 Lex Fridman 以及 Y Combinator 的创始合伙人 Paul Graham 都已经签名。

尽管 LIama 是开源模型，但Mozilla 公司的资深信任AI会员 Abeba Birhane 在推特上提到，Meta 并未发布创建该模型所使用的训练数据来源。缺乏训练数据的透明度仍然是一些 LLM 批评人士所在意的点，因为教授这些LLM“知识”的训练数据来自对互联网的未授权爬虫，从而很少关注隐私或商业影响。Meta 公司在 LIama 2 研究论文中表示，“努力删除了包含私密个体大量个人信息的某些站点”，但并未列出这些站点有哪些。

目前，任何人都可以填写 Meta 网站上的一份表单获取下载 LIama 2的访问权限。Ars Technica 提交了下载请求并在约一小时后获得下载链接，说明列表可能是手动筛选的。

代码卫士试用地址：https://codesafe.qianxin.com

开源卫士试用地址：https://oss.qianxin.com

推荐阅读

奇安信入选全球《静态应用安全测试全景图》代表厂商

奇安信入选全球《软件成分分析全景图》代表厂商

Meta解雇数十名劫持用户Facebook和Instagram 账户的员工

Meta 推出完整性检查绕过漏洞奖励计划

AI管道的十大常见风险

OpenAI 推出百万美元网络安全资助计划

真实大揭秘：生成式AI到底对网络安全行业造成了哪些影响？

原文链接