搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
weixin_40725706
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Python爬虫天津景点数据可视化和景点推荐系统 开题报告
2
腾讯云服务器Centos,Docker中安装RabbitMQ_腾讯云搭建rabbitmq
3
图片情感识别_图片的情感分类模型
4
动态网页数据获取实战_wininet动态网站数据
5
【Linux】Linux第一个程序-进度条_linux shell 进度条
6
Ubuntu20.04 配置安装运行 Dave (水下SLAM 仿真环境)_project dave
7
进阶玩法丨如何用ChatGPT,1小时写一本10万字小说!(实操教程)_gpt如何处理长10万字
8
浅谈自然语言处理(NLP)学习路线(二):N-Gram模型,一文带你理解N-Gram语言模型
9
too many connections 解决方法_c#连接 1040 too many connections
10
Docker容器化实战第三课 dockerfile介绍、容器安全与监控讲解_run ln -sf
当前位置:
article
> 正文
PEFT(参数高效微调)_参数高效微调(peft)
作者:weixin_40725706 | 2024-04-05 10:21:29
赞
踩
参数高效微调(peft)
PEFT现在的方法总览
Seletive
Adapter
LoRA: Low-Rank Adaptation of Large Language Models(低秩微调大模型) (ICLR 2022)
差距大的任务,增大rank可能带来性能提升
优点
+稳定
+可以同时用LoRA+adaptor etc
prompt tuning
1.介绍
背景
何为prompt tuning
2. 编写prompt(prompt design) 2个原则
2.1 编写明确提示
2.1.1长的clear的指令>短的指令
2.1.2分隔符
2.1.3结构化输出(JSON和HTML)
2.2给LLM足够时间思考
2.2.1指定完成任务的步骤(Chain-of thought)
2.2.2 在让模型做出决策前先思考 自己的解决方案
2.2.3给定指定的示例,few-shot
2.3.1幻觉 (由于并没有记住每一个话,所以会有合理但不正确真实的回答)
比如模型会创造一个相当逼真的虚构的产品名称描述
追溯文档可以减少幻觉
2.2.4 角色扮演
弊端
多数偏差和最近偏差
幻象
3.学习prompt(prompt tuning)
只调propmt的文本 (Tuning-free prompting)
把prompt embed之后,训练prompt的词向量 (现在prompt tuning基本上是这种 )
Pre-trained Prompt Tuning for Few-shot Learning (ACL 2022) 、The Power of Scale for Parameter-Efficient Prompt Tuning (EMNLP 2021)
效果
Soft prompt和hard prompt
所以 有按任务做不同的预训练prompt(用作初始化)
预训练prompt的具体方法
视觉的visual prompt tuning
VPT:就是NLP中加前缀Prefix,然后只用训练前缀。的给定一个预先训练好的Transformer,在Embed层后的输入空间引入一组d维的p连续embedding。在微调过程中,只有prompt会被更新,主干将会冻结,
加像素),结果比传统的fine_tuning即Linear probe甚至full fine-tuning好,参数量和adapter差不多(
视觉-文本多模态prompt
CoOp: Learning to Prompt for Vision-Language Models
用到再说了
三种PRFT方法的实现
总结:
+LoRA可以合用
留坑:CoT,ToT,GoT的prompt方法
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/weixin_40725706/article/detail/365031
推荐阅读
article
Appium
基础 —
APPium
安装_
appium
server
安装...
我们要使用
APPium
测试框架,首先就需要安装
APPium
服务,Devices代表我们要链接的手机,
Appium
Cli...
赞
踩
article
Appium
入门
安装
搭建
环境
完整教程加实现过程
经验总结
_
appium
安装
...
需要添加至
环境
变量的路径有如下截图中的内容:最后再次在cmd命令行运行
appium
-doctor进行检测,看到一片绿色,...
赞
踩
article
Spring
Boot
的
核心
组件
和工作原理_
springboot
的
核心
组件
...
Spring
Boot
是一个快速、简便、可靠的框架,它的
核心
思想是约定优于配置,通过自动配置、Starter和Actua...
赞
踩
article
大
语言
模型
(LLM)在
分子
领域中的最新
应用
汇总_
大
语言
模型
的各类
应用
...
目前
大
模型
应用
已经非常广泛,但在
分子
领域依然进展不
大
,为了提高药物发现的速度与质量,为医学界提供新的技术支持,研究人员正...
赞
踩
article
[
Kaggle
]
Spam
/Ham Email Classification 垃圾邮件分类(spac...
文章目录1. 导入包2. 数据预览2. 特征组合3. 建模4. 训练5. 预测练习地址:https://www.kagg...
赞
踩
article
深度
学习
中的算子...
在
深度
学习
中,层是模型的构建单元,它们通过各自定义的算子作用于函数空间,将输入数据映射到越来越抽象的特征表示,直至输出层...
赞
踩
article
【
Docker
】个人
镜像
文件
Docker
file制作详解_
docker
文件
制作详细
讲解
...
Docker
是一个`开源的应用容器引擎`,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行...
赞
踩
article
web
前端
月刊
-
35
期(202103)...
新兴
前端
框架 Svelte 从入门到原理本文介绍了Svelte框架的特性、优缺点和底层原理,并和React,Vue进行了...
赞
踩
article
接入
Claude2
API
的完整
Python
客户端
指南
_
claude2
接口...
python
客户端
实现通过cookie 调用
claude2
api。多账号可以实现无限制使用。
_
claude2
接口cla...
赞
踩
article
数字
乡村
创新实践探索:科技赋能
农业
现代化
与
乡村
治理
体系
现代化
同步推进...
随着信息技术的飞速发展,
数字
乡村
作为
乡村
振兴的重要战略方向,正日益成为推动
农业
现代化
和
乡村
治理
体系
现代化
的关键力量。科技...
赞
踩
article
restTemplate
发送请求时出现415问题解决_
org
.
springframework
.web...
restTemplate
发送请求时出现415问题解决解决方案记录出现
org
.
springframework
.web.cl...
赞
踩
article
Mac
M2芯片
VMware
Fusion
虚拟机
安装
Centos
(ARM 64 版本)...
因为自己换了
Mac
M2芯片的本,它并不能使用X86框架或者Arm框架的镜像,导致
Centos
镜像直接报错“无法打开此虚...
赞
踩
article
JWT
多
系统
登录
鉴权
、授权验证
--
可用_
jwt
多
系统
登录
鉴权
...
首先流程图来一波!!!!具体实现代码工具类JwtTokenUtils如下:import io.jsonwebtoken....
赞
踩
article
RT
-
DETR
改进策略:
UniRepLKNet
,
大核
卷积
的
最新成果
,
轻量高效
的
首选(全网首发)...
使用非常大
的
卷积
核
的
卷积
神经网络(ConvNets)
的
设计范式起源于ReplkNet [11]
,
当时ConvNets
的
地...
赞
踩
article
Sora
- 探索
AI
视频
模型的无限可能_
sora
的多帧预测
生成
...
Open
AI
推出的首个
AI
视频
模型
Sora
,以其卓越的性能和前瞻性的技术,引领着
AI
视频
领域的创新发展。_
sora
的多帧...
赞
踩
article
Python
-
数据分析
-《
Python
数据分析
从
0
到
1
》书籍推荐
_
python
数据分析
教材
...
随着信息技术和人工智能产业的蓬勃发展,数据成为时代发展下的珍贵资源。各行各业通过
数据分析
技术挖掘数据的价值,
数据分析
技术...
赞
踩
article
国产
化改造之
应用
替代
方案(未完)
_
tomcat
国产
替代
...
随着国内IT厂商多年技术发展,相关
国产
软件也已经能满足基本日常使用,且很多已通过大规模节点生产验证,再信创的大背景下,本...
赞
踩
article
【
力扣
】
383
.
赎金
信...
【
力扣
】
383
.
赎金
信【
力扣
】
383
.
赎金
信 题目描述 给你两个...
赞
踩
article
ubuntu18.04
更换
gcc
版本
_
unbutu18.04
修改
gcc
版本
...
ubuntu18.04
更换
gcc
版本
查看当前
gcc
版本
gcc
-v安装新
版本
的
gcc
sudo apt install g...
赞
踩
article
Docker
:探索
容器
化
技术
,重塑云
计算
时代
应用
交付与管理...
在
容器
技术
领域,
Docker
并非唯一的玩家,实际上,伴随着
Docker
的崛起与普及,一系列其他的
容器
技术
也应运而生,共同...
赞
踩
相关标签
android
adb
appium自动化测试
appium
自动化
spring boot
spring
java
人工智能
药物分子
大语言模型
LLM
论文
深度学习
docker
容器
运维
javascript
python
chatgpt
ai
科技
智慧乡村
数字乡村