当前位置:   article > 正文

一键部署本地AI大模型,全脚本实现_本地部署ai合集

本地部署ai合集

一、快捷部署

  1. #!/bin/bash
  2. #################################################################################
  3. # 作者:cxy@toctalk@hwy 2024-04-09
  4. # 功能:自动部署Ollama(Docker方式)
  5. # 说明:如果已安装了Docker,请注释掉 install_docker,避免重复安装
  6. #################################################################################
  7. info(){
  8. echo -e "\033[34m 【`date '+%Y-%m-%d %H:%M:%S'`】\033[0m" "\033[35m$1\033[0m "
  9. }
  10. install_docker(){
  11. #!/bin/bash
  12. info "安装依赖..."
  13. yum -y install gcc
  14. yum -y install gcc-c++
  15. ##验证gcc版本
  16. gcc -v
  17. info "安装Docker(指定版本:23.0.6)"
  18. wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O/etc/yum.repos.d/docker-ce.repo
  19. ##更新yum软件包索引
  20. yum makecache fast
  21. ## 安装docker ce cli
  22. # 查看可安装版本:yum list docker-ce --showduplicates | sort -r
  23. yum -y install docker-ce-23.0.6-1.el7 docker-ce-cli-23.0.6-1.el7
  24. info "启动Docker并验证"
  25. systemctl enable docker && systemctl start docker
  26. docker version
  27. ## 创建加速器
  28. #cd /etc/docker
  29. #if [ ! -f "$daemon.json" ]; then
  30. # touch "$daemon.json"
  31. #else
  32. # rm -rf daemon.json
  33. # touch "$daemon.json"
  34. #fi
  35. #tee /etc/docker/daemon.json <<-'EOF'
  36. #{
  37. # "registry-mirrors": ["https://自己的镜像加速器地址"]
  38. #}
  39. #EOF
  40. #systemctl daemon-reload
  41. #systemctl restart docker
  42. info "Docker(23.0.6)安装完毕!"
  43. }
  44. # 安装 Ollama
  45. install_Ollama(){
  46. info "参考IP地址:"$(hostname -I)
  47. read -p "请问,您当前服务器的内网IP地址是?:" inner_ip
  48. inner_ip="${inner_ip:-127.0.0.1}"
  49. docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama --restart always ollama/ollama
  50. info "ollama部署完毕,开始下载gemma大模型..."
  51. docker exec -it ollama ollama run gemma “你好”
  52. info "gemma大模型加载完成,开始部署webui界面..."
  53. docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=http://${inner_ip}:11434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui:main
  54. eip=$(curl ifconfig.me/ip)
  55. info "部署完毕,正在启动WEBUI界面,大约5分钟后,请访问:http://${eip}:3000"
  56. }
  57. install_docker
  58. install_Ollama

使用方法:

  1. $ vim install-ollama-centos7.sh
  2. $ chmod +x install-ollama-centos7.sh
  3. $ ./install-ollama-centos7.sh
  4. # 感谢淘客科技提供的实验资源环境

验证:

  1. 1、docker ps (能看到2个容器实例正在运行)
  2. 2、浏览器访问:http://eip:3000 (需要等待WEBUI启动,并且放通了3000端口的访问规则)
  3. # open-webui启动有些慢,通过日志查看进度
  4. $ docker logs -f open-webui

ollama-控制台.png

注意事项:
1、目前镜像及大模型下载速度尚可,但由于容量较大,所以建议使用100Mbit/s以上的带宽。
2、2个容器镜像大小约为4G左右,大模型采用Gemma:9B,大约4.7G。
3、Ollama启动方式采用CPU only,由于没有GPU,所以运行速度较慢,建议采用16核以上的服务器。
4、为了降低入门体验门槛,所以规避掉了对于硬件GPU的要求,如想“顺滑”体验,还请使用带GPU的基础设施。
5、脚本部署过程,控制台会提示,输入内网IP地址,输入后才会继续执行,切勿一直等待。
6、本文脚本不适用于带GPU的设备,如有需要,请参见官网或关注后续博文。

二、入门体验

chat界面.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/785789
推荐阅读
相关标签
  

闽ICP备14008679号