搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Monodyee
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
BiLSTM+CRF医学病例命名实体识别项目
2
matlab for hold 画图,我用matlab写的程序为什么画图不能全部显示?for i=1:5\x05line([0,50],[i,i]);endaxis equalaxis off%画符干...
3
C# FileToStream 文件转换成文件流_c# ifromfile转stream
4
对不同的人说不同的话的职场口才分享_对不同的人说不同的人
5
大模型日报-20240104_justine tunney
6
华为Could API人工智能系列——自然语言处理——属性级情感分析
7
图像检索(含代码)_用代码实现搜索用户及结果图
8
Hadoop和Hbase版本对应关系(参考官网)_hadoop hbase 对应
9
程序员:在这技术更新如此快的时代,注意别因学太多而被压垮了_程序员 学习量太大
10
【黑马-SpringCloud技术栈】【02】服务拆分及远程调用_服务提供者与消费者_黑马程序员springcloud
当前位置:
article
> 正文
Transformer的前世今生 day08(Positional Encoding)
作者:Monodyee | 2024-03-30 06:06:10
赞
踩
Transformer的前世今生 day08(Positional Encoding)
前情提要
Attention的优点:解决了长序列依赖问题,可以并行。Attention的缺点:开销变大了,而且不存在位置关系
为了解决Attention中不存在位置关系的缺点,我们通过位置编码的形式加上位置关系
Positional Encoding(位置编码)
通过在原输入词向量的基础上,给他加一个位置编码,组成新的输入词向量
位置编码的具体公式,如下:
其中:pos指当前单词在句子中的位置,i指位置编码维度的第几维(通常来说词向量的维度为512,那么i就是0-511,表示第几维)
所以,对于某个词的位置编码,偶数维度用了sin函数,奇数维度用了cos函数
得到位置编码后,与输入词向量X叠加后,得到新的输入词向量X’
由于sin和cos函数有以下公式,那么我们可以得到某一个位置的位置编码和其他两个位置的位置编码之间的关系,如下:
所以,当我们使用位置编码的这个函数时,对于pos+k位置的位置向量某一维2i或2i+1而言,可以表示为,pos位置与k位置的位置向量2i和2i+1的线性组合,而这个线性组合意味着pos+k的位置向量中蕴含了pos位置和k位置的位置信息
而且这个位置编码的位置信息具有独特性,会随着我们输入句子的顺序改变而发生改变,比如“我爱你”中的你的位置编码,和“你爱我”中的你的位置编码所蕴含的位置信息就不同
参考文献
14 Positional Encoding (为什么 Self-Attention 需要位置编码)
1401 位置编码公式详细理解补充
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Monodyee/article/detail/339380
推荐阅读
article
论文阅读——
Rein
_
rein
transformer
...
_
rein
transformer
rein
transformer
Stronger, Fewe...
赞
踩
article
AI:
Transformer
架构
简介及实践
_
ai
transformer
...
其中这些给出的提示就可以看作是key,而整个的文本信息就相当于是query,value的含义则更抽象,可以比作你看到这段...
赞
踩
article
释放
生成式
AI 中
Transformer
的创造力_
from
transformers
impo...
在不断发展的人工智能领域,近年来有一个名字脱颖而出:
Transformer
。这些强大的模型改变了我们在人工智能中处理生...
赞
踩
article
AI
大
模型
应用
入门实战与进阶:深入理解
Transformer
架构
_
大
数据ai
transformer
...
Transformer
是Google在2017年提出的一种新型神经网络
架构
1,它被广泛
应用
于自然语言处理(NLP)领域,...
赞
踩
article
Transformer
架构
逐层
功能介绍
和
详细解释
_
逐层
特征
外化...
多年来,深度学习一直在不断发展。深度学习实践高度强调使用大量参数来提取有关我们正在处理的数据集的有用信息。通过拥有大量参...
赞
踩
article
AI
Transformer
:
最新进展
及其应用场景解析
_
transformer
最新进展
...
作者:禅与计算机程序设计艺术 1.简介随着人工智能(
AI
)技术的飞速发展,深度学习(DL)和Transforme...
赞
踩
article
AI
大
模型
应用入门实战与进阶:4.
Transformer
模型
的
实战与进阶_大
模型
transfor...
1.背景介绍
Transformer
模型
是一种深度学习
模型
,由Google
的
AI
研究团队在2017年发表
的
论文《Atten...
赞
踩
article
人工智能
大
模型
原理
与应用实战:从
Transformer
到
Vision
Transformer
...
人工智能
(Artificial Intelligence, AI)是计算机科学的一个分支,研究如何让计算机模拟人类智能。...
赞
踩
article
[论文阅读]
CenterFormer
——基于
center
的三维目标检测Trans
for
mer_cen...
本文介绍了一种基于
center
的三维目标检测Trans
for
mer——
CenterFormer
。该方法在处理LiDAR点...
赞
踩
article
【
Transformer
】
基于
Transformer
的
目标
检测
算法
综述_
transformer
目标
检...
基于
Transformer
的
目标
检测
算法
的研究综述_
transformer
目标
检测
综述
transformer
目标
检测
综述...
赞
踩
article
单目标追踪——【Trans
for
mer】
Learning
Spatio
-
Temporal
Trans...
这篇文章提出了一个端到端的Trans
for
mer架构,一共有两个具体实现的网络结构——Baseline网络【仅考虑空间特...
赞
踩
article
(
DSTT
)
Decoupled
Spatial-
Temporal
Trans
for
mer
for
V...
Abstract Video inpainting aims to fill the given spatiotempo...
赞
踩
article
ICCV
2021
论文
汇总!
Vision
Transformer
...
作者丨AI算法与图像处理@知乎来源丨https://zhuanlan.zhihu.com/p/395764136编辑丨计...
赞
踩
article
《论文阅读》
PCT
:
Point
Cloud
Transformer
...
留个笔记自用
PCT
:
Point
Cloud
Transformer
做什么点云的概念:点云是在同一空间参考系下表达目标空...
赞
踩
article
【3D目标
分类
】
PCT
:
Point
Cloud
Transformer
...
文章目录前言摘要1.介绍2.相关工作3.
Transformer
for
Point
Cloud
Representati...
赞
踩
article
基于深度
学习
方法的
点云
算法4——
PCT
:
Point
Cloud
Transformer
(
点云
分类
分...
不规则域和缺乏有序性使得设计用于
点云
处理的深层神经网络具有挑战性。提出了一种新的
点云
学习
框架
Point
Cloud
Tr...
赞
踩
article
「论文阅读」
PCT
:
Point
Cloud
Transformer
...
目录
PCT
的点云处理编码器(Encoder):物体分类语义分割法线估计Naive
PCT
S
PCT
全
PCT
受Transfo...
赞
踩
article
论文解读
PCT
:
Point
Cloud
Transformer
(用于
点云
处理
的Transforme...
最近几年transformer越来越火,在NLP、CV等领域都取得了很大的成功。这篇文章作者利用了transformer...
赞
踩
article
三维目标检测
---
PointCloudTransformer
论文解读
_
point
cloud
tra...
代码链接paper链接论文总结本文提出了一种在适用于点云的Transformer结构。根据点云数据的特点进一步改善了Tr...
赞
踩
article
【论文笔记】
PCT
:
Point
Cloud
Transformer
...
这是清华大学在2021年3月上传的关于将transformer应用在点云上的一篇论文。与其同期的还有两篇相似论文。本篇论...
赞
踩
相关标签
人工智能
深度学习
机器学习
transformer
注意力机制
架构
原理
计算
大数据
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
神经网络
自然语言处理
编程实践
开发语言