赞
踩
聚焦源代码安全,网罗国内外最新资讯!
编译:代码卫士
本周二,Meta 宣布推出AI语言模型的新开源家族 LIama 2,它具有商用许可证,意味着和之前的模型不同,这些新模型可集成到商业产品中。这些新模型的规模从7个参数到700亿个参数不等,据称“超过我们所测试的多数基准上的开源聊天模型”。
Meta 公司的首席AI科学家杨立昆 (Yann LeCun) 提到,“LLM 市场格局将由此改变。LIama-v2 已可在微软 Azure 上获取,后续将在 AWS、Hugging Face 和其它提供商上发布。”
Meta 公司指出,LIama 2“预训练”模型在2万亿个令牌上进行训练且上下文窗口为4096个令牌(文字片段)。上下文窗口决定了模型可一次处理的内容长度。Meta 还提到 LIama 2 优化模型为类似于 ChatGPT 的聊天应用程序而开发,已在“超过100万个人类标注”进行训练。
虽然在性能方面,LIama 2无法与 OpenAI 的 GPT-4 相媲美,但作为开源模型它表现不俗。英伟达公司的资深AI科学家 Jim Fan 提到,“虽然在推理任务方面,70B与GPT-3.5类似,但在编码基准方面差异巨大。在多数基准上,它与 PaLM-540B 不相上下甚至更好,但仍然远远落后于 GPT-4和 PaLM-2-L。”Meta 公司在周二发布的研究论文中详述了 LIama 2 的性能、基准和构建。
2月份,Meta 发布了 LIama2 的前身 LLaMA,它也是开源版本且具有非商用许可证。虽然官方表明仅供学术界通过某些凭据使用,但不久之后有人在种子站点上泄露了 LLaMA 的权重(包含训练神经网络参数值的文件),且在AI社区大肆传播。不久之后,LLaMA 的优化变体如 Alpaca 出现,为不断增长的地下 LLM 开发提供了种子。
LIama 2 通过对商用的补贴使这一活动更加公开,尽管“在上个月,每月超过7亿活跃用户的潜在许可者”必须从 Meta 获得特殊许可才能使用它,从而使亚马逊或谷歌这样体量的巨头无法免费使用。
开源AI的强大和危险
虽然开源的 AI 模型颇受爱好者和寻求未审查聊天机器人受众的欢迎,但同时也引来争议。在支持重大开源基础模型的技术巨头和闭源一角的巨头如OpenAI、微软和谷歌等之间,Meta 显得孤单。
批评人士认为,开源的AI模型存在很多潜在风险,如合成生物学中的滥用情况或者生成垃圾邮件或错误信息。很容易想象到LIama 2 会出现其中一些风险,虽然这类使用违反Meta的使用条款。目前,如果有人通过 OpenAI 的 ChatGPT API 执行了受限操作,那么这种访问权限将被撤销。但对于开源软件而言,一旦这些权重发布,则没有要回的机会。
不过,开源AI的支持者认为,开源AI模型提倡透明性(在使透明度成立的训练数据方面)、促进经济竞争(不止将技术限制于巨头企业)、孤立言论自由(没有审查)以及使AI访问民主化(没有付费限制)。
或许是预想到对开源模型发布的潜在批评,Meta 还发布了一份简短的“支持 Meta 对当前AI的开放方式声明”指出,“我们支持对AI的开放创新方式。负责任和开放的创新使我们所有人都在AI开发流程中具有利害关系,为这类技术带来可见性、审查和信任。开放LIama 模型将使所有人受益于这一技术。”
截止到周二下午,许多管理人员和教育人员如Dropbox 公司的首席执行官 Drew Houston、Andreessen Horowitz 的合伙人 Matt Bornstein、Hugging Face 的首席技术官 Julien Chaumond、MIT的研发科学家 Lex Fridman 以及 Y Combinator 的创始合伙人 Paul Graham 都已经签名。
尽管 LIama 是开源模型,但Mozilla 公司的资深信任AI会员 Abeba Birhane 在推特上提到,Meta 并未发布创建该模型所使用的训练数据来源。缺乏训练数据的透明度仍然是一些 LLM 批评人士所在意的点,因为教授这些LLM“知识”的训练数据来自对互联网的未授权爬虫,从而很少关注隐私或商业影响。Meta 公司在 LIama 2 研究论文中表示,“努力删除了包含私密个体大量个人信息的某些站点”,但并未列出这些站点有哪些。
目前,任何人都可以填写 Meta 网站上的一份表单获取下载 LIama 2的访问权限。Ars Technica 提交了下载请求并在约一小时后获得下载链接,说明列表可能是手动筛选的。
代码卫士试用地址:https://codesafe.qianxin.com
开源卫士试用地址:https://oss.qianxin.com
推荐阅读
Meta解雇数十名劫持用户Facebook和Instagram 账户的员工
原文链接
https://arstechnica.com/information-technology/2023/07/meta-launches-llama-2-an-open-source-ai-model-that-allows-commercial-applications/
题图:Pixabay License
本文由奇安信编译,不代表奇安信观点。转载请注明“转自奇安信代码卫士 https://codesafe.qianxin.com”。
奇安信代码卫士 (codesafe)
国内首个专注于软件开发安全的产品线。
觉得不错,就点个 “在看” 或 "赞” 吧~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。