torch.nn.Embedding_def embedding(weight: tensor, indices: tensor, pad

作者：AllinToyou | 2024-04-05 06:14:29

踩

def embedding(weight: tensor, indices: tensor, padding_idx: _int=-1, scale_g

详见官方文档

class torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, device=None, dtype=None)
1

参数解读

num_embeddings (int) – 词嵌入矩阵的大小，即有多少个词嵌入向量 对应行
embedding_dim (int) – 每个词嵌入向量的维度 对应列
padding_idx (int, optional) – 可选参数。如果指定该参数，则 padding_idx 将不会再 training 中更新，即将保持一个固定向量不变

torch.nn.Embedding 作用

是一个简单的查找表，用于存储固定字典和大小的嵌入
该模块通常用于存储词嵌入并使用索引检索它们

~Embedding.weight (Tensor) – 维度为 $num\_embeddings, embedding\_dim)$ 的可学习权重矩阵，初始化为 $N (0, 1)$

Embedding 输入、输出

该模块的输入是索引列表，输出是相应的词嵌入
Input: $(*)$ , 待词嵌入的单词序列（IntTensor or LongTensor 类型）
Output: $(*, H)$ ，其中 * 是 input shape， $H=embedding\_dim$

例子

>>> # 嵌入矩阵大小 (10, 3)，即 10 个向量，每个向量维度为 (3, 1)
>>> embedding = nn.Embedding(10, 3)
>>> # a batch of 2 samples of 4 indices each
>>> input = torch.LongTensor([[1,2,4,5],[4,3,2,9]])
>>> embedding(input)
tensor([[[-0.0251, -1.6902,  0.7172],
         [-0.6431,  0.0748,  0.6969],
         [ 1.4970,  1.3448, -0.9685],
         [-0.3677, -2.7265, -0.1685]],

        [[ 1.4970,  1.3448, -0.9685],
         [ 0.4362, -0.4004,  0.9400],
         [-0.6431,  0.0748,  0.6969],
         [ 0.9124, -2.3616,  1.1151]]])

>>> # 使用 padding_idx （这里用 0 填充 <pad> ）
>>> embedding = nn.Embedding(10, 3, padding_idx=0)
>>> input = torch.LongTensor([[0,2,0,5]])
>>> embedding(input)
tensor([[[ 0.0000,  0.0000,  0.0000],
         [ 0.1535, -2.0309,  0.9315],
         [ 0.0000,  0.0000,  0.0000],
         [-0.1655,  0.9897,  0.0635]]])

# 测试
>>> embedding(torch.LongTensor([0]))
tensor([[0., 0., 0.]], grad_fn=<EmbeddingBackward>)
>>> embedding(torch.LongTensor([2]))
tensor([[ 0.1535, -2.0309,  0.9315]], grad_fn=<EmbeddingBackward>)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】