当前位置:   article > 正文

Meta 发布开源且可商用的 AI 模型 LIama 2

liama

4ea1aab6f095a87047fe2614344ae699.gif 聚焦源代码安全,网罗国内外最新资讯!

编译:代码卫士

本周二,Meta 宣布推出AI语言模型的新开源家族 LIama 2,它具有商用许可证,意味着和之前的模型不同,这些新模型可集成到商业产品中。这些新模型的规模从7个参数到700亿个参数不等,据称“超过我们所测试的多数基准上的开源聊天模型”。

9bd80b6769ad7514db9acb2eb9ebf614.gif

Meta 公司的首席AI科学家杨立昆 (Yann LeCun) 提到,“LLM 市场格局将由此改变。LIama-v2 已可在微软 Azure 上获取,后续将在 AWS、Hugging Face 和其它提供商上发布。”

Meta 公司指出,LIama 2“预训练”模型在2万亿个令牌上进行训练且上下文窗口为4096个令牌(文字片段)。上下文窗口决定了模型可一次处理的内容长度。Meta 还提到 LIama 2 优化模型为类似于 ChatGPT 的聊天应用程序而开发,已在“超过100万个人类标注”进行训练。

虽然在性能方面,LIama 2无法与 OpenAI 的 GPT-4 相媲美,但作为开源模型它表现不俗。英伟达公司的资深AI科学家 Jim Fan 提到,“虽然在推理任务方面,70B与GPT-3.5类似,但在编码基准方面差异巨大。在多数基准上,它与 PaLM-540B 不相上下甚至更好,但仍然远远落后于 GPT-4和 PaLM-2-L。”Meta 公司在周二发布的研究论文中详述了 LIama 2 的性能、基准和构建。

2月份,Meta 发布了 LIama2 的前身 LLaMA,它也是开源版本且具有非商用许可证。虽然官方表明仅供学术界通过某些凭据使用,但不久之后有人在种子站点上泄露了 LLaMA 的权重(包含训练神经网络参数值的文件),且在AI社区大肆传播。不久之后,LLaMA 的优化变体如 Alpaca 出现,为不断增长的地下 LLM 开发提供了种子。

LIama 2 通过对商用的补贴使这一活动更加公开,尽管“在上个月,每月超过7亿活跃用户的潜在许可者”必须从 Meta 获得特殊许可才能使用它,从而使亚马逊或谷歌这样体量的巨头无法免费使用。

20471068f69f40784eca6a29993458d1.gif

开源AI的强大和危险

虽然开源的 AI 模型颇受爱好者和寻求未审查聊天机器人受众的欢迎,但同时也引来争议。在支持重大开源基础模型的技术巨头和闭源一角的巨头如OpenAI、微软和谷歌等之间,Meta 显得孤单。

批评人士认为,开源的AI模型存在很多潜在风险,如合成生物学中的滥用情况或者生成垃圾邮件或错误信息。很容易想象到LIama 2 会出现其中一些风险,虽然这类使用违反Meta的使用条款。目前,如果有人通过 OpenAI 的 ChatGPT API 执行了受限操作,那么这种访问权限将被撤销。但对于开源软件而言,一旦这些权重发布,则没有要回的机会。

不过,开源AI的支持者认为,开源AI模型提倡透明性(在使透明度成立的训练数据方面)、促进经济竞争(不止将技术限制于巨头企业)、孤立言论自由(没有审查)以及使AI访问民主化(没有付费限制)。

或许是预想到对开源模型发布的潜在批评,Meta 还发布了一份简短的“支持 Meta 对当前AI的开放方式声明”指出,“我们支持对AI的开放创新方式。负责任和开放的创新使我们所有人都在AI开发流程中具有利害关系,为这类技术带来可见性、审查和信任。开放LIama 模型将使所有人受益于这一技术。”

截止到周二下午,许多管理人员和教育人员如Dropbox 公司的首席执行官 Drew Houston、Andreessen Horowitz 的合伙人 Matt Bornstein、Hugging Face 的首席技术官 Julien Chaumond、MIT的研发科学家 Lex Fridman 以及 Y Combinator 的创始合伙人 Paul Graham 都已经签名。

尽管 LIama 是开源模型,但Mozilla 公司的资深信任AI会员 Abeba Birhane 在推特上提到,Meta 并未发布创建该模型所使用的训练数据来源。缺乏训练数据的透明度仍然是一些 LLM 批评人士所在意的点,因为教授这些LLM“知识”的训练数据来自对互联网的未授权爬虫,从而很少关注隐私或商业影响。Meta 公司在 LIama 2 研究论文中表示,“努力删除了包含私密个体大量个人信息的某些站点”,但并未列出这些站点有哪些。

目前,任何人都可以填写 Meta 网站上的一份表单获取下载 LIama 2的访问权限。Ars Technica 提交了下载请求并在约一小时后获得下载链接,说明列表可能是手动筛选的。

代码卫士试用地址:https://codesafe.qianxin.com

开源卫士试用地址:https://oss.qianxin.com


推荐阅读

奇安信入选全球《静态应用安全测试全景图》代表厂商

奇安信入选全球《软件成分分析全景图》代表厂商

Meta解雇数十名劫持用户Facebook和Instagram 账户的员工

Meta 推出完整性检查绕过漏洞奖励计划

AI管道的十大常见风险

OpenAI 推出百万美元网络安全资助计划

真实大揭秘:生成式AI到底对网络安全行业造成了哪些影响?

原文链接

https://arstechnica.com/information-technology/2023/07/meta-launches-llama-2-an-open-source-ai-model-that-allows-commercial-applications/

题图:Pixabay License

本文由奇安信编译,不代表奇安信观点。转载请注明“转自奇安信代码卫士 https://codesafe.qianxin.com”。

1aea05f849462d3e54ac797e9b2734ab.jpeg

ca0d28ec1b3d9386791e4e7aad1f9465.jpeg

奇安信代码卫士 (codesafe)

国内首个专注于软件开发安全的产品线。

   bfa6aa8ed83cab1a6179e6ca065cf468.gif 觉得不错,就点个 “在看” 或 "赞” 吧~

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
  

闽ICP备14008679号