赞
踩
大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此,本教程不同文字或理论介绍内容,而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读,助力大模型使用。
本篇文章基于基于上一章构建Demo解读Trainer的train()源码,并给出一个完整train()源码流程。
之前文章已给出Trainer来训练模型Demo。可知,Trainer的train()是整个模型训练集成,我后面会对该源码相关详细细节解读。这里,我先给出train函数源码。
train函数是Trainer类的一个方法函数,其完整源码如下:
def train(
self,
resume_from_checkpoint: Optional[Union[
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。