Datawhale AI夏令营第四期：动手学大模型应用全栈开发task1

作者：神奇cpp | 2024-08-13 05:38:22

踩

一、环境配置

速览：这边笔记将会带大家快速跑一遍baseline，再带大家精读一下baseline。

参考教程：Datawhale

一、环境配置

首先我们配置环境，这里笔者使用阿里云的PAI-DSW服务，可以申请试用，可获得 5000算力时！有效期3个月！开通方法可以参考Datawhale。

去到PAI-DSW创建一个PAI实例并打开：

打开后是这个界面：

二、Demo搭建！

2.1文件下载

我们可以用git将案例文件下来到服务器上：

点击终端出入以下命令后按回车：


git lfs install
git clone https://www.modelscope.cn/datasets/Datawhale/AICamp_yuan_baseline.git

2.2安装前端工具

在终端输入以下命令，回车运行：

pip install streamlit==1.24.0

之后等待依赖安装成功即可。

2.3启动Demo

在终端输入以下命令，回车运行：

streamlit run AICamp_yuan_baseline/Task\ 1：零基础玩转源大模型/web_demo_2b.py --server.address 127.0.0.1 --server.port 6007

这个Demo是用Streamlit搭建的前端页面，Streamlit简单易上手~可以快速搭建自己的web页面，它还有如下特点：

实时推理

将大模型部署在后台服务器上，通过 Streamlit 提供的接口，用户可以输入数据，实时获取模型的推理结果。

交互式调参

使用 Streamlit 的滑块、选择框等组件，允许用户动态调整大模型的参数（如温度、最大生成长度等），并实时查看输出结果。

OK，现在我们点击链接，跳转到新页面：

等待后台模型下载完成之后就可以对话啦！

我们让他帮忙写一道leetcode：

可以看到生成的代码通过了测试。我们可以多尝试一下，可以给出不同的解法：

我们再让它换一种解法：

发现报错，具体原因在下一章章节，精读baseline会提到。

三、精读baseline

3.1 baseline代码


# 导入所需的库
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st
 
# 创建一个标题和一个副标题
st.title("声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/神奇cpp/article/detail/973442
推荐阅读
article记一次：Datawhale AI夏令营-第四期-魔塔-AIGC-Task01...
这期夏令营其实是根据阿里的天池大赛进行准备的，也就是说这个夏令营是组织你来参加一下这个比赛。然后顺便让你学习一些AIGC...
                                    赞
踩
article【Datawhale AI夏令营第四期】魔搭-AIGC方向 Task01笔记...
基础文生图模型优化，可控生成与图像编辑，生成采样加速。扩散模型的本质：不断去噪，将一个纯粹的高斯噪声转换为真实有美感的图...
                                    赞
踩
articleDatawhale X 魔搭 AI夏令营第四期-魔搭生图task1学习笔记...
2.简单列举一下赛事的要求以及任务参赛者需在可图Kolors 模型的基础上训练LoRA 模型，生成无限风格，如水墨画风格...
                                    赞
踩
articleDataWhale AI夏令营3-Task 1...
【代码】DataWhale AI夏令营3-Task 1。DataWhale AI夏令营3-Task 1         ...
                                    赞
踩
articleDatawhale AI夏令营--task01笔记...
从零入门AI生图原理&实践 是Datawhile 2024年AI夏令营第四期AIGC方向学习活动，基于魔搭社区“可图Ko...
                                    赞
踩
articleDatawhale AI夏令营 - Task1笔记...
在深度学习中，模型训练通常需要进行多次迭代，而不是单次完成。深度学习模型的训练本质上是一个优化问题，目标是最小化损失函数...
                                    赞
踩
articleDatawhale AI 夏令营 NLP-TASK1...
之所以被称为“基于规则的方法”，是因为同一种语义在不同的语言当中通常会以不同的词序去表达，词替换过程相对应地需要两种语言...
                                    赞
踩
article“Datawhale AI夏令营”-Task1...
关于在“Datawhale AI夏令营”-Task1，30min体验baseline.“Datawhale AI夏令营”...
                                    赞
踩
articleDataWhale AI 夏令营-task1...
。DataWhale AI 夏令营-task1                                  一...
                                    赞
踩
articleDatawhale AI 夏令营-Task1 笔记总结...
Datawhale AI 夏令营-Task1 笔记总结Datawhale AI 夏令营-Task1 笔记总结      ...
                                    赞
踩
articleDatawhale AI 夏令营2024-cv--task3...
随着深度学习在计算机视觉的广泛应用，以卷积神经网络为代表的深度学习模型取得了突破性的进展。在现实世界的应用中，获取大量且...
                                    赞
踩
article【DataWhale AI夏令营】--Task 3...
数据预处理# 将数据按照id进行分组# 准备训练数据集for i in range(10, 15): # 每个id构建5...
                                    赞
踩
article【Datawhale 】Datawhale AI 夏令营-Task3笔记...
else:type")这个函数用于绘制图像，并在图像上绘制边界框和分割掩码。检查输入图像格式确保输入是二维网格，即使只有...
                                    赞
踩
article【DataWhale AI夏令营】--Task 2...
数据切分：依据dt列切分数据集，确保时间序列的前后关系。超参数调优：手动设置初始参数，可以通过网格搜索等方法进一步优化。...
                                    赞
踩
articleDataWhale AI夏令营3-Task 2...
根据任务需求构建输入文本，包括问题和相关的上下文信息，确保输入文本格式符合大语言模型的输入要求。收集或生成包含逻辑推理问...
                                    赞
踩
articleDatawhale AI 夏令营第四期大模型应用开发笔记...
当前环节可让你在内，从一个完全小白的选手，搭建开通免费试用在进行授权链接：新用户需要先注册 & 绑定阿里云账号新用户还需...
                                    赞
踩
article【Datawhale X 魔搭 】AI夏令营第四期大模型方向，Task1：智能编程助手（持续更新）...
在一个数据驱动的世界里，人工智能的未来应由每一个愿意学习和探索的人共同塑造和掌握。希望这里是你实现AI梦想的起点。第一步...
                                    赞
踩
article基于Spark AI的进行模型微调(DataWhale AI夏令营)...
Hello，大家好，我是GISer Liu基于Spark AI的进行模型微调(DataWhale AI夏令营)     ...
                                    赞
踩
相关标签
人工智能
AIGC
学习
笔记
机器学习
python
深度学习
大模型
阿里云
ＡＩ