【DeepLearning-2】预归一化（Pre-Normalization）策略

作者：程序代码艺术家 | 2024-01-26 11:19:55

踩

2.1层归一化（Layer Normalization）在 `PreNorm` 类中的数学原理：

2.2代码实现：


class PreNorm(nn.Module):
    def __init__(self, dim, fn):
        super().__init__()
        self.norm = nn.LayerNorm(dim)
        self.fn = fn 
    
    def forward(self, x, **kwargs):
        return self.fn(self.norm(x), **kwargs)

层归一化:

self.norm = nn.LayerNorm(dim)

前向传播（forward 方法）:

def forward(self, x, **kwargs): 在前向传播过程中，PreNorm 类首先对输入 x 应用层归一化，然后将归一化后的结果传递给 fn 函数或模块。
return self.fn(self.norm(x), **kwargs): 这行代码先对 x 应用层归一化，然后将归一化的结果传递给 fn。这里的 **kwargs 允许传递额外的参数给 fn 函数。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/article/detail/41957

【DeepLearning-2】预归一化（Pre-Normalization）策略

2.1层归一化（Layer Normalization）在 PreNorm 类中的数学原理：

2.2代码实现：

2.1层归一化（Layer Normalization）在 `PreNorm` 类中的数学原理：