AllinToyou

这个屌丝很懒，什么也没留下！

热门标签

Chat-GLM 详细部署（GPU显存＞=12GB）_chatglm

作者：AllinToyou | 2024-04-01 10:49:37

踩

chatglm

建议配置: ( Windows OS 11 部署 )
CPU-i7 13700F ~ 13700KF
RAM: 16GB DDR4
GPU: RTX3080(12G)

安装 conda:

1. 下载安装 miniconda3 ：
https://docs.conda.io/en/latest/miniconda.html
conda是一个包和环境管理工具，它不仅能管理包，还能隔离和管理不同python版本的环境。类似管理nodejs环境的nvm工具。

2. conda环境变量：
新建 CONDA_HOME ：conda安装路径


在Path中添加 ：%CONDA_HOME%  
在Path中添加 ：%CONDA_HOME%\Scripts
在Path中添加 ：%CONDA_HOME%\Miniconda3\Library\bin

3. 激活conda:
打开CMD执行conda init

4. 测试conda安装是否成功:
打开CMD输入conda -V 回车后显示版本号表示Conda安装成功。

5. 更换源:


conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

6. 问题解决:
如果创建环境时报错：


An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.

找到C盘：.condarc 文件（一般是在 C:\Users\你电脑的用户名下，没有的话全盘搜索下）
打开.condarc 文件并替换内容为：


channels:
  - defaults
show_channel_urls: true
default_channels:
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
custom_channels:
  conda-forge: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

打开CMD输入conda clean -i 回车。

安装 CUDA与Torch：

1. 确认CUDA版本号:
在CMD中输入nvidia-smi 查询CUDA版本号。

2. 下载CUDA:
去官网下载对应的CUDA版本（CUDA Toolkit）
https://developer.nvidia.com/cuda-toolkit-archive

3. 安装CUDA：

4. CUDA环境变量：
一般来说安装完成后会自动添加环境变量，可以检查一下，如果没添加则需要添加一下：
CUDA_PATH
CUDA_PATH_V11_8
值为上一步选择安装位置的路径。

5. 测试CUDA安装是否成功:
打开CMD输入nvcc --version 回车显示版本号代表安装完成。

6. 安装Torch:
下载对应CUDA版本的Torch（这里用的版本是11.8）

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

用python代码测试torch是否生效，如果不生效找对应cuda版本下载torch（torch.cuda.is_available()返回false则不生效）


import torch
print(torch.__version__)
print(torch.cuda.is_available())

安装配置 ChatGLM

1. 克隆项目到本地:
如果没git需要安装git
CD到目标文件夹内执行命令：git clone https://github.com/THUDM/ChatGLM-6B.git

2. 创建conda工程:
打开CMD将目录CD到工程内。

执行命令：conda create --name ChatGLM-6B python=3.10.10

激活conda工程：conda activate ChatGLM-6B

3. 安装支持库
执行命令 ( 清华源 ) ：


pip install pip -U
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

这里在国内使用清华源加速

4. 启动web测试：
安装库（清华源)


pip install streamlit -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
pip install streamlit_chat -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
pip install chardet -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

执行Demo ：streamlit run web_demo2.py 输入Email。

复制URL到浏览器则可以预览：

模型下载完成才可以正常对话，如果报错换下VPN节点多试几次

5. API部署
首先需要安装额外的依赖 pip install fastapi uvicorn，然后运行仓库中的 api.py：

python api.py

默认部署在本地的 8000 端口，通过 POST 方法进行调用


curl -X POST "http://127.0.0.1:8000" \
     -H 'Content-Type: application/json' \
     -d '{"prompt": "你好", "history": []}'

得到的返回值为


{
  "response":"你好       本文内容由网友自发贡献，转载请注明出处：https://www.wpsshop.cn/w/AllinToyou/article/detail/348575
推荐阅读
article【ChatGPT】开源软件：ChatALL —— 我是 GitHub 榜一！(PS: 其实，小编本地...
给第一次听说 ChatALL 的朋友介绍下它吧。很简单，它就是个每次遇到问题，我们总想请教有经验的人，且希望不只是一个人...
                                    赞
踩
article【AIGC】Gemma和ChatGLM3-6B使用体验_gemma chatglm...
综上所述，Gemma和ChatGLM3-6B都是优秀的对话预训练模型，但在不同的应用场景和任务中可能表现出不同的优势。G...
                                    赞
踩
articlechatglm 测试1...
显存占用 18874-5603 = 13271 MiB 内存61.27-56.48=4.79G。内存 58.40-56....
                                    赞
踩
articleLLM - ChatGLM-6B Lora 微调与推理_chatglm2-6b训练lora...
ChatGLM-6B Lora 微调与推理流程详解。_chatglm2-6b训练lorachatglm2-6b训练lor...
                                    赞
踩
article开源模型应用落地-qwen1.5-7b-chat-LoRA微调（二）...
使用QWen官方方式微调qwen1.5-7b-chat模型开源模型应用落地-qwen1.5-7b-chat-LoRA微调...
                                    赞
踩
articleLLaMa、Qwen、ChatGLM、ChatGLM2的区别_chatglm qwen...
原始bert，LayerNorm + multiHeadAttention + dropout + FFN + drop...
                                    赞
踩
article国内外各ChatGPT类语言大模型API价格汇总, 对比，ChatGPT/Gmini/PaLM/Cl...
2023年，国内外的IT公司大都发布了自己的类ChatGPT语言大模型，有种“百模大战”的味道。至2024.01.01,...
                                    赞
踩
articleChatGLM-6B 中文对话模型复现、调用模块、微调及部署实现（更新中）_chatglm 可复现性...
近期，清华开源了其中文对话大模型的小参数量版本 ChatGLM-6B（GitHub地址：https://github.c...
                                    赞
踩
articleChatGLM2-6B、ChatGLM-6B 模型介绍及训练自己数据集实战_chatglm训练...
ChatGLM2-6B 模型介绍及训练实战_chatglm训练chatglm训练                    ...
                                    赞
踩
articleChatGLM-6B开源模型环境配置与部署_chatglm-6b部署需要什么配置...
chatglm6B开源模型环境配置与部署_chatglm-6b部署需要什么配置chatglm-6b部署需要什么配置   ...
                                    赞
踩
articleChatGLM-6B部署和微调实例_chatglm-6b 微调...
ChatGLM-6B是本人尝试使用和微调的第一个大语言模型，自我感觉该模型很适合作为大语言模型的入门级选手，无论是部署配...
                                    赞
踩
article全球大型语言模型(LLMS)现状与比较_mychandler.bet/chat...
截至2024年3月，全球已发布或开发超过100个大语言模型（LLMs），参数量达万亿级。文档比较了OpenAI的GPT系...
                                    赞
踩
articleLLM-项目详解-InstructKGC（一）：FineTuning ChatGLM With Lo...
根据用户输入的指令抽取相应类型的实体和关系，构建知识图谱。其中可能包含知识图谱补全任务，即任务需要模型在抽取实体关系三元...
                                    赞
踩
article实现langchain-ChatGLM API调用客户端（及未解决的问题）_langchain ap...
langchain-ChatGLM是一个基于本地知识库的LLM对话库。其基于text2vec-large-Chinese...
                                    赞
踩
articleGPT4、文心一言4、ChatGLM、Claude2.1四大语言模型生成效果对比_文心一言和chat...
随着AIGC大风起，也掀起了语言模型大争之世，各种语言模型如雨后春笋，让大家眼花缭乱。周周都有新的选手入场，月月都有新的...
                                    赞
踩
article文言一心，ChatGLM-6B和ChatGPT等模型概述_文言一心大模型...
大模型在 NLP 任务中的出色表现确实为人工智能领域带来了新的发展和探索方向。语言作为思想的符号，是人类交流和表达的主要...
                                    赞
踩
article解决使用OpenAI gym进行调试时抛出异常的问题_openai.error.invalidreq...
解决使用OpenAI gym进行调试时抛出异常的问题环境Linux/Ubuntu16.04anaconda3解决方法pi...
                                    赞
踩
articleChatGLM 本地部署的详细教程_chatglm本地部署...
4. 下载预训练模型：ChatGLM使用预训练的GPT模型来生成回复。您可以从OpenAI（https://beta.o...
                                    赞
踩
article本地部署 langchain-ChatGLM...
大型语言模型（LLM）正在成为一种变革性的技术，使开发者能够建立他们以前无法建立的应用程序。然而，孤立地使用这些LLM往...
                                    赞
踩
article我是如何使用 GitHub Copilot Chat 来调试我的部署工作流的_github copi...
我喜欢这个的原因是它不仅提供了如何解决问题的建议，copilot 还给了我一点启发：我不知道工作流是从仓库的根目录运行的...
                                    赞
踩
相关标签
chatgpt
人工智能
AIGC
python
语言模型
LLM
ChatGLM-6B
Lora
深度学习
自然语言处理
llama
gpt
pytorch
价格
api
openai
谷歌
baidu
ernie
nlp

Chat-GLM 详细部署（GPU显存＞=12GB）_chatglm

建议配置: ( Windows OS 11 部署 )CPU-i7 13700F ~ 13700KF RAM: 16GB DDR4 GPU: RTX3080(12G)

安装 conda:

1. 下载安装 miniconda3 ： https://docs.conda.io/en/latest/miniconda.html conda是一个包和环境管理工具，它不仅能管理包，还能隔离和管理不同python版本的环境。类似管理nodejs环境的nvm工具。

2. conda环境变量： 新建 CONDA_HOME ：conda安装路径

3. 激活conda: 打开CMD执行conda init

4. 测试conda安装是否成功: 打开CMD输入conda -V 回车后显示版本号表示Conda安装成功。

5. 更换源:

6. 问题解决: 如果创建环境时报错：

安装 CUDA与Torch：

1. 确认CUDA版本号: 在CMD中输入nvidia-smi 查询CUDA版本号。

2. 下载CUDA:去官网下载对应的CUDA版本（CUDA Toolkit） https://developer.nvidia.com/cuda-toolkit-archive