当前位置:   article > 正文

transdreamer 论文阅读笔记

transdreamer 论文阅读笔记

在这里插入图片描述

  • 这篇文章是对dreamer系列的改进,是一篇world model 的论文
  • 改进点在于,dreamer用的是循环神经网络,本文想把它改成transformer,并且希望能利用transformer实现并行训练。
  • 改成transformer的话有个地方要改掉,dreamer用ht和xt来预测zt,但transformer要实现并行训练的话,最好是不要有ht,因为ht依赖transformer来预测,而transformer又需要zt作为输入,形成循环依赖就只能一步一步地生成。为此,把zt的预测改成只依赖于xt。如下所示:
    在这里插入图片描述
  • policy model的输入是ht和zt的concatenate
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小舞很执着/article/detail/754122
推荐阅读
相关标签
  

闽ICP备14008679号