搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
爱喝兽奶帝天荒
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
FPGA组成,工作原理与开发流程_fpga lab名词解释
2
【技巧】如何检查多个GPU之间是否支持P2P通信
3
OpenAI重磅发布 GPT-4o!向免费客户开放,GPT-4o官方使用指南分享_openai gpt-4o可以用了吗
4
迎接 GPT-5:人工智能的新时代与我们的准备
5
关于安卓DialogFragment使用(二)_android dialogfragment 封装
6
神经网络——Python实现Hopfield神经网络算法(理论+例子+程序)_python神经算法
7
TDengine Cloud 新增签约,这次是能源物联网平台
8
「51媒体」湖北地区媒体邀约
9
2024华为Java高级面试题及答案,最详细的解释小白也能听懂_华为java面试题
10
Docker Desktop 4.15 正式发布,这里是新功能_docker for mac 4.15.0
当前位置:
article
> 正文
【LLM大模型】模型和指令微调方法_大模型 微调 样本标记方法
作者:爱喝兽奶帝天荒 | 2024-06-19 22:27:03
赞
踩
大模型 微调 样本标记方法
note
Hugging Face 的 PEFT是一个库(LoRA 是其支持的技术之一,除此之外还有Prefix Tuning、P-Tuning、Prompt Tuning),可以让你使用各种基于 Transformer 结构的语言模型进行高效微调。
AIpaca羊驼:让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循(instruction-following)样本,以此作为 Alpaca 的训练数据,最后训练的羊驼只有7B参数量。可以使用LoRA微调优化。
LLM技术思路:
语言模型:llama、bloom、glm等
指令微调数据:alpaca_data、bella_data、guanaco_data等。目前指令微调数据上,很依赖alpaca以及chatgpt的self-instruct数据。数据处理参考下图:
微调加速: lora(如Alpaca-Lora)等,还可以使用peft库、量化工具包bitsandbytes、deepspeed(先读torch.distributed和ColossalAI在搞)、llama.cpp量化模型。在LoRA方法提出之前,也有很多方法尝试解决大模型微调困境的方法。其中有两个主要的方向:
添加adapter层。adapter就是固定原有的参数,并添加一些额外参数用于微调;
由于某种形式的输入层激活。
训练优化方法:量化、3D并行、cpu卸载
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
Spark
MLlib
LinearRegression
线性
回归算法源码解析_
spark
mllib
...
线性
回归一元
线性
回归 hθ(x)=θ0+θ1xhθ(x)=θ0+θ1x h_θ(x)=θ_0+θ_1x ——————–1...
赞
踩
article
事务
的
4
种
隔离
级别
(
Isolation
Level
)分别是什么?...
事务
的
4
种
隔离
级别
(
Isolation
Level
)分别是什么?..._
4
种
隔离
等级
4
种
隔离
等级 ...
赞
踩
article
Git
with
(
reflog
)_
git
reflog
命令
...
git
cmd_
git
reflog
命令
git
reflog
命令
...
赞
踩
article
数据结构
与
算法
—
插入
排序
&
选择
排序
_
插入
排序
和
选择
排序
...
介绍
数据结构
与
算法
中:
插入
排序
和
选择
排序
_
插入
排序
和
选择
排序
插入
排序
和
选择
排序
目录 一...
赞
踩
article
工具链
--
nuxt
框架
简介(
一
)...
Nuxt
框架
是
一
个基于Vue.js的服务器端渲染(SSR)
框架
,旨在提供
一
套完整的前端开发解决方案,帮助开发者构建高性能...
赞
踩
article
儿童
安全
座椅
-开题报告...
本课题利用蓝牙设备传递信号,使用单片机处理数据并输出相关命令,通过重力传感器监测
座椅
是否有坐人。从而实现以下效果:
安全
带...
赞
踩
article
推荐:
AWS
IoT
SDK
for
JavaScript
—— 高效可靠
的
物联网
开发工具
...
推荐:
AWS
IoT
SDK
for
JavaScript
—— 高效可靠
的
物联网
开发工具
项目地址:https://gi...
赞
踩
article
Mysql
可
重复
读
业务
场景
_
MySQL
事务隔离级别...
对于数据库的隔离级别之前一直没有做详细整理,最近项目运行中发现了一个问题,所以抽时间对这块认真研究了下业务
场景
:服务A在...
赞
踩
article
备战
蓝桥
杯
eda
(三)
_
蓝桥
杯
eda
国赛
...
今日练习利用自设快捷键绘制元器件原理图。所练元器件链接:http://www.360doc.com/content/18...
赞
踩
article
部署
Redis
集群
详细
步骤
+详解+
案例
实体操作_
redis54
集群
...
NOSQL(Not Only SQL)今天阿坤为大家带来详细的
Redis
集群
搭建详细
步骤
!!!**
案例
1:
部署
redis...
赞
踩
article
解决No
module
named
‘
ultralytics
‘
_
module
no
tfounderro...
的程序时,程序语句from
ultralytics
.utils.plotting import An
no
tator, c...
赞
踩
article
本地
部署
大
模型
(
按顺序
复制
命令即可!!!
)
_
本地
大
模型
部署
...
系统环境:
(
我这里用的是ubuntu22.04,不是说Windows不好,只是我在用Windows的时候,有很多奇怪的小...
赞
踩
article
【头歌】
二叉
树
的
二叉
链表
存储
及
基本
操作
_
二叉
树
的
基本
操作
。以
二叉
链表
作为
二叉
树
的
存储
结构
,设计并实现...
中序遍历序列
的
特点:若已知
二叉
树
的
根结点值,以该值为界,将中序遍历序列分为两部分,前半部分为左子树
的
中序遍历序列,后半部...
赞
踩
article
com
.
mysql
.
jdbc
.
Driver
和
com
.
mysql
.cj.
jdbc
.
Driver
的...
大家在连接
mysql
的时候,启动项目,会警告你推荐使用
com
.
mysql
.cj.
jdbc
.
Driver
而不是
com
.m...
赞
踩
article
机器
学习
课程复习——
ANN
...
机器
学习
课程复习——
ANN
机器
学习
课程复习——
ANN
Q:
ANN
? 基本架构 由输入层、...
赞
踩
article
【
Perl
语言
】
Perl
语言
基础入门指南
_
perl
脚本
...
Perl
(Practical Extraction and Report Language)是一种功能强大的编程
语言
,由...
赞
踩
article
linux
企业版
火绒
(
火绒
终端
安全
管理系统
V2
,
面试网络
安全
开发十大问题_
火绒
有
linux
版吗...
还有兄弟不知道网络
安全
面试可以提前刷题吗?费时一周整理的160+网络
安全
面试题
,
金九银十
,
做网络
安全
面试里的显眼包!王岚...
赞
踩
article
AWS
CloudFront
怎么计费
的
?...
费用根据地区(如美国、欧洲、亚洲等)
的
不同而有所差异,区域内(例如,美国境内)传输通常比区域间(例如,从美国到亚洲)传输...
赞
踩
article
【云原生】
kubernetes
中的
认证
、
权限
设置
--
RBAC
授权
原理分析与应用实战_
rbac
认证
...
k8s对我们整个系统的
认证
,
授权
,访问控制做了精密的设置;对于k8s集群来说,apiserver是整个集群访问控制的唯一...
赞
踩
article
类
android
设备
reset
过程...
模式解析流程frameworks/base/core/java/
android
/os/PowerManager.java...
赞
踩
相关标签
Spark
MLlib
git
排序算法
数据结构
算法
工具链
nuxt
前端框架
51单片机
单片机
嵌入式硬件
proteus
Mysql可重复读业务场景
经验分享
其他
硬件
深度学习
人工智能
conda
pytorch
语言模型
链表
adb