当前位置:   article > 正文

第五章:huggingface的Trainer.train()源码与流程解读_huggingface trainer.train()

huggingface trainer.train()


前言

大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此,本教程不同文字或理论介绍内容,而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读,助力大模型使用。

本篇文章基于基于上一章构建Demo解读Trainer的train()源码,并给出一个完整train()源码流程。


一、train()函数源码

之前文章已给出Trainer来训练模型Demo。可知,Trainer的train()是整个模型训练集成,我后面会对该源码相关详细细节解读。这里,我先给出train函数源码。

train函数是Trainer类的一个方法函数,其完整源码如下:


    def train(
        self,
        resume_from_checkpoint: Optional[Union[
  • 1
  • 2
  • 3
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/码创造者/article/detail/835306
推荐阅读
相关标签
  

闽ICP备14008679号