赞
踩
从GitHub上拉去项目到本地,准备已训练好的模型百度网盘:提取码【9dvu】。
开发者
下管理GPU性能计数器
,导航栏点击桌面
选择启用开发者设置
,弹出的系统信息
中找到组件,找到产品名前缀为NVIDIA CUDA
的那一条,记住其后面的版本号。CUDA
,找到上一步记录的NVIDIA CUDA
后的版本号相对应的链接。如版本信息为11.4
就选择11.4
CUDA
版本,下载压缩包cudnn
xxx\NVIDIA GPU Computing Toolkit\CUDA\v11.4
目录下pytorch配置
a. 去pytorch官网找到相应的gpu
版本或cpu
版本,找到后安装命令会出现在command
栏
找不到自己的版本点击previous version
链接
b. 使用管理员
身份执行cmd
,否则会安装失败
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
安装完成之后执行命令conda list
查看是否安装成功
打开终端输入python
,使用以下代码查看torch
显示GPU
不可用状态
>>>import torch
>>>torch.cuda.is_available()
False
c. 标准查看torch版本
>>>import torch
>>>torch.__version__
1.10.2
pytorch
轮子配置
a. whl轮子配置,根据CUDA
版本选择相应的版本。其中cu
表示GPU版本
,cpu
表示CPU版本
b. 下载完成之后本地使用pip install
安装
pip install .\torchvision-0.13.1+cpu-cp39-cp39-win_amd64.whl
pip install .\torch-1.10.2+cu113-cp39-cp39-win_amd64.whl
c. 安装完成之后验证torch
>>>import torch
>>>torch.cuda.is_available()
True
python3.7.1版本
conda create -n venv_name python=3.7.1
conda activate venv_name
pip install transformers==2.1.1
pip install tensorflow==2.0.0
pip install numpy
pip install tqdm
pip install sklearn
pip install keras
pip install tb-nightly
pip install future
pip install thulac
pip install setuptools==59.5.0
pip install torch==1.10.2+cu113 torchvision==0.3.0 --extra-index-url
参数说明:
# 通用模型预测文本
python ./generate.py --length=100 --nsamples=4 --prefix=天津是一座美丽的城市。 --fast_pattern --save_samples ----model_path=model/use_model --model_config=config/model_config_small.json --topk=8 --temperature=0.8 --batch_size=2
# 制定模型输出
python ./generate.py --length=300 --nsamples=4 --prefix=萧炎,斗之力。 --fast_pattern --save_samples --model_path=model/model_epoch18 --model_config=model/model_epoch18/config.json --topk=8 --temperature=1 --batch_size=1
其他参数参考:
将训练语料以train.json
的格式放入data
目录中
如果文件格式为train.json
格式,那么将train.py
文件中的读取方式为:lines = json.load(f)
如果文件格式为train.txt
格式,即数据格式为[”正文1“, ”正文2“, ”正文3“]
,那么将train.py
文件中的读取方式为:lines = f.readlines()
运行train.py
文件并设定--raw
参数,会自动预处理数据,预处理完成之后,会自动执行训练。
python train.py --raw
config
文件中选择小一点的json文件generate.py
中的batch_size=1
此训练结果生成比较简单的文章还可以,但是需要达到理想的效果,还需要更大的数据体系和语料以及长期的模型训练,基于原有的算法二次开发,门槛也比较高,而且这种业务比较吃硬件资源。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。