搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
知新_RL
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
测试工具分享:高效完成测试工作!
2
智能科学与技术 毕业设计 - 选题建议 题目推荐 毕设指导 开题报告_人工智能毕业设计选题
3
python tokenize_python – 滥用nltk的word_tokenize(已发送)的后果
4
学C#好还是学C++好啊
5
PyTorch: 序列到序列模型(Seq2Seq)实现机器翻译实战
6
cvpr2013收录的文章_carl olsson, olof enqvist
7
sklearn: TfidfVectorizer 中文处理及一些使用参数_tfidfvectorizer函数参数
8
如何实现百度翻译接口——不用申请API接口密钥
9
GPT-4技术报告_gpt4技术报告
10
Android实现新闻列表
当前位置:
article
> 正文
书生浦语大模型全链路开源体系-课程笔记
作者:知新_RL | 2024-04-06 06:04:08
赞
踩
书生浦语大模型全链路开源体系-课程笔记
书生浦语大模型全链路开源体系
以高质量开源赋能创新
大模型成为发展通用人工智能的重要途径
。
2021年之前是针对特定任务,一个模型解决一个问题(ImageNet竞赛2012、人脸识别2014、围棋比赛2016、AlphaFold2021)
最近两年在向通用大模型发展,一个模型应对多种任务、多种模态。
InternLM2 概述
书生浦语的开源历程
2023年6月7日InternLM开源
2024年1月17日InternLM2开源
书生浦语2.0(InternLM2)的体系
尺寸
模型基座(可塑性强)
多能力强化(推荐用于微调)
对话交互优化
7B 轻量化
InternLM2-Base
InternLM2
InternLM2-Chat
20B 综合能力强
InternLM2-Base
InternLM2
InternLM2-Chat
InternLM2:回归语言建模的本质
新一点
数据清洗
过滤技术
多维度数据价值评估
高质量预料驱动的数据富集
有针对性的数据补齐
InternLM2的主要亮点
超强的上下文
综合性能全面提升。代码、数学、推理、知识、语言、考试,20B的模型比肩GPT3.5。
优秀的对话和创作体验。想象力ok。
工具调用能力整体升级。日程安排。
突出的数理能力和实用的数据分析功能。高准确率,复杂运算和求解,加入代码解释器后,在GSM8K和MATH上超过GPT4。上传表格,分析表格文件,概述,绘制趋势图(调用maiplot),要求模型使用机器学习算法做预测(sklearn)。
从模型到应用
应用:智能客服、个人助手、行业应用
从模型到应用是有GAP的,需要一个复杂的流程
书生浦语全链条开源开放体系
开发了全链条的工具
数据
OpenDataLab:书生万卷1.0(2TB),书生万卷CC(400GB)
预训练
微调
XTuner开源框架
增量续训:新知识、垂直领域知识
有监督微调:可以降低微调成本
评测
2024年1月30日,
OpenCompass2.0
司南大模型评测体系
CompassRank:中立全面的性能榜单
CompassKit:大模型评测全站工具链。
数据污染检查
更丰富的模型推理接入
长文本能力评测
中英文双语主观评测
CompassHub:高质量评测基准社区
希望构建大模型评测基准社区
OpenCompass助力大模型产业发展和学术研究,广泛应用于头部大模型企业和科研机构,获得Meta官方推荐
根据评测结果洞见未来,形成年度榜单综合性客观评价,语言、知识、推理、数学、代码、智能体。国内部分大模型已经接近GPT4水平,国内模型在中文场景有优势,开源社区未来可期。
整体能力仍有较大提升空间
复杂推理仍是短板
“理科”能力和模型尺寸关联性高
模型主客观性能需综合参考
部署
LMDeploy
部署通常是模型上线环节的最后一个环节
LMDeploy在A100上的部署效率高于vLLM
智能体
轻量级智能体框架Lagent
有很多内置工具,可以直接使用,比如代码解数学题、零样本泛化
多模态智能体工具箱AgentLego,是一个工具集合。可以将语言模型拓展为多模态智能体。
封装了OpenMMLab,SD,SAM等等模型。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/知新_RL/article/detail/370202
推荐阅读
article
噪音
标签
工作总结
_
噪声
标签
...
本文介绍了
噪声
标签
相关的基本概念和解决
噪声
标签
问题的各种各样的方法及分类。
_
噪声
标签
噪声
标签
...
赞
踩
article
mySOA
:敏捷
的
、
治理
的
并且可
持续
的
...
SOA是在各种报道中频繁提及
的
一个话题。在阅读了很多书、文章、软件提供商们
的
各种白皮书以及博客文章之后,我仍然在探索如何...
赞
踩
article
xlive
.
dll
文件
丢失
了
要怎么处理?快速
修复
xlive
.
dll
的
方法
...
涉及到Windows系统上运行游戏或应用程序时,
xlive
.
dll
文件
丢失
可能成为一个影响体验的常见错误。这个DLL(动...
赞
踩
article
【
知识
图谱
】
Neo4j
导入
数据
构建
知识
图谱
的三种方法
_
neo4j
如何
导入
数据
...
目录
Neo4j
数据
导入
5种方式1、使用Cypher语言创建1.1 创建节点【create】1.2 修改节点的属性1.3创...
赞
踩
article
python
树莓
派
经典
书籍
推荐
_
树莓
派
教程
书籍
推荐
:带你玩转
Raspberry
Pi
...
随着《星球大战》《复仇者联盟》《NASA》等科幻电影的热映,人工制作装置也更加受到人们关注,与这些电影有关的一切设备都显...
赞
踩
article
**
Star
CCM
安装
教程
(
linux
环境下)*_
starccm
linux
版
安装
教程
...
如何在
linux
下
安装
并破解
Star
CCM
+13.02.011?目前网上大多是win上面
安装
STAR-
CCM
+ 的
教程
...
赞
踩
article
pytorch2.0
版本
简介...
PyTorch 2.0 中发布了大量足以改变 PyTorch 使用方式的新功能,它提供了相同的 eager mode 和...
赞
踩
article
本科
论文
查重
会检测
AI
辅写
疑似度吗?――深度剖析与应对策略_
本科
毕业
论文
查重
率算
aigc
吗吗...
然而,随之而来的是关于
AI
辅写
疑似度的争议。随着
AI
技术的快速发展,越来越多的
本科
生选择使用
AI
写作工具辅助完成
论文
。这...
赞
踩
article
用
java
制作
心理
测试软件
_润贤AI智能
心理
测评
系统
在儿保科的应
用
...
润贤®AI智能
心理
测评
系统
在儿保科的应
用
01测试简介 0-6岁发育筛查
测试软件
可以
用
发育商来评价孩子的智能发育速率,也可...
赞
踩
article
DeepMind
爆发史:决定
AI
高峰的“
游戏
玩家
”|深度
学习
崛起
十年
...
来源:OneFlow社区翻译:刘晓祯、沈佳丽、胡燕君、许晨阳、周亚坤很少有人会否认,过去
十年
,
AI
领域最耀眼的明星组织当...
赞
踩
article
Python
_基于长短期记忆网络(
LSTM
)的电商
评论
情感
分析
预测
Python
数据
分析
实战
数据
可...
近些年,随着计算机技术的不断发展,神经网络在预测方面的应用愈加广泛,尤其是长短期记忆人工神经网络(Long Short-...
赞
踩
article
【好物
推荐
】
VScode
的
常用
插件
推荐
_
vscode
插件
推荐
...
EditorConfig
插件
可以让你在 VS Code 中使用 .editorconfig 文件来统一代码风格。这个文...
赞
踩
article
整理
一个
学习
AI
的
步骤
、
提纲
_
ai
算法
的
一般
步骤
有哪些...
不过,
学习
数学建模和物理学等领域
的
知识也对理解和应用人工智能
算法
非常有帮助,因为这些领域
的
理论和方法经常被应用于人工智能...
赞
踩
article
BEVFusion
(
mit
)最强
环境
安装
,
部署复现...
BEVFusion
作为一项经典的工作
,
值得深入探索。然而由于配置
环境
比较麻烦
,
耽误了一些时间。经过几次成功配置之后
,
有了...
赞
踩
article
大
模型
训练
,多模态
数据
处理
与融合_大
模型
中
针对不同类型
数据
的
处理
方式...
在我们的方案
中
,ERNIE-Gram
模型
被用于对领域文本进行编码,将文本转换为向量表示,以便后续的匹配算法使用。通过对比...
赞
踩
article
Python
套索
回归
lasso
、
SCAD
、
LARS
分析棒球运动员薪水3个实例合集|附
数据
代码...
全文链接:https://tecdat.cn/?p=35585在
数据
科学和机器学习领域,
回归
分析是一种强大的工具,用于探...
赞
踩
article
Unity
结合
Flask
实现
排行榜
功能_
flask
框架连接
unity
...
业余做的小游戏,
排行榜
本来是用PlayerPrefs存储在本地,现在想将数据放在服务器上。因为功能很简单,就选择了小巧玲...
赞
踩
article
七.使用
OpenCv
进行
图像
颜色
识别
_
opencv
轮廓内
颜色
加深
...
接着上一篇的
图像
灰度处理后,接下来对灰度
图像
进行
颜色
识别,本人的方法比较简单,有其他好方法的可以提出来,大家共同进步。目...
赞
踩
article
msvcr110
.
dll
文件
丢失
要怎么办?教
你
多种
解决
msvcr110
.
dll
文件
的
方法
...
面对“程序无法启动,因为电脑中缺失
msvcr110
.
dll
”的错误提示,
你
可能会觉得
你
的工作或者休闲时间被意外中断了,这...
赞
踩
article
知识
图谱
关键技术
及行业
应用
解读...
本文来自公众号PlantData
知识
图谱
实战(ID:KGPlantData),内容整理自胡芳槐博士6月9日北理工
知识
图谱
...
赞
踩
相关标签
人工智能
深度学习
dll文件
dll丢失
dll
电脑程序故障
知识图谱
Neo4j数据导入
load csv
neo4j admin
neo4j import
python树莓派经典书籍推荐
linux
cfd
pytorch
用java制作心理测试软件
游戏
大数据
编程语言
consul
rnn
python
数据分析
自然语言处理