赞
踩
双向RNN可以做encoder,但不能做decoder。
上面的公式既加入了段序列的惩罚项,又加入了更难出现的长序列的高权重。
下面,我们动手构建 seq2seq的设计, 并将基于“英-法”数据集来训练这个机器翻译模型。
import collections
import math
import torch
from torch import nn
from d2l import torch as d2l
现在,来实现循环神经网络编码器。 注意,我们使用了嵌入层(embedding layer)
来获得输入序列中每个词元的特征向量。 嵌入层的权重是一个矩阵, 其行数等于输入词表的大小(vocab_size)
, 其列数等于特征向量的维度(embed_size)
。 对于任意输入词元的索引 声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/345847
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。