搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Li_阴宅
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Flink学习教程_flink1.17 中文文档
2
2024国内主流AI 大模型架构及应用场景深度分析_商汤 腾讯 华为
3
nsd-kdd数据预处理python代码
4
K近邻算法——手写数字识别_k近邻算法实现手写数字识别
5
Ansys Rocky在电池制造行业应用
6
神经网络参数更新公式推导(一)——单隐层网络_神经网络权重更新公式
7
Android开源框架(整理)_android原生开发框架
8
camera驱动_camera driver属于vendor还是system
9
【Arduino与mpu6050握手】_mpu6050识别手势
10
Llama 3.1 模型:从部署到微调的全方位应用手册_lama3.1
当前位置:
article
> 正文
大模型基本知识
作者:Li_阴宅 | 2024-08-20 01:15:17
赞
踩
大模型基本知识
1. 大模型资源站
github:
https://github.com/
魔塔:
modelscpace.cn
2. 大模型
架构
公共底座:transformer
Encoder-Decoder架构:
T5 - NLG
ChatLM - NLG
Encoder-Only架构:
BERT:NLU
模型:
https://modelscope.cn/models/iic/nlp_bert_backbone_base_std/summary
论文:
https://arxiv.org/pdf/1810.04805
GLM:
论文:
https://arxiv.org/pdf/2103.10360
模型:
https://modelscope.cn/models/ZhipuAI/chatglm3-6b/summary
中国唯一一家具有 OpenAI 气质的公司
天才般的设计
ChatGLM3 6b
Decoder-Only架构:
剩下的所有LLM大模型
LLaMA的儿孙模型
Llama3:
模型:
魔搭社区
QWen:
QWen1.5-0.5B-Chat:
魔搭社区
Phi:
魔搭社区
3. 模型预训练、微调
模型预训练:
各大模型都会提供自身的预训练代码和微调数据格式和代码
公共预训练微调框架:
llama-factory
4. 高性能部署
vLLM
OpenAI API
LMStudio 高性能推理
llama.cpp
5. 工程落地
LangChain
RAG(检索增强生成)
Agent(智能体)
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Li_阴宅/article/detail/1004461
推荐阅读
article
Flink
CDC读取
MySQL
的例子_
flinkcdc
读取
mysql
...
本文详细介绍了如何配置
MySQL
以启用binlog,以及如何利用
Flink
SQL读取
MySQL
数据。首先,通过修改my....
赞
踩
article
soup
.
find
_
all
()用法_
soup
.
find
all
...
find
_
all
() 1. 查找标签
soup
.
find
_
all
('tag') 2. 查找文本
soup
.
find
_al...
赞
踩
article
SAP
的
数据
科学实践_
sap
主题域
数据
分析
...
企业
数据
的机器学习技术文章目录1 前言a. 如何读这本书b.这本书的使用场景c.使用代码例子d. O'Reilly 在线...
赞
踩
article
keil
5使用
c++
编写
stm32
控制程序_
keil
c++
...
想着搞个新奇的玩意玩一玩来着,想用
c++
编写代码来控制
stm32
,结果在
keil
5中,把踩给我踩闷了,这里简单记录一下。...
赞
踩
article
2017
嵌入式
行业现状分析...
近十年是我国
嵌入式
系统事业快速发展的十年,
嵌入式
软件技术得到飞速发展。微处理器从8位到16位、32位甚至64位;从支持单...
赞
踩
article
Python3
网络
爬虫
开发实战(9)
代理
的
使用
(需补充
代理
池
的
构建)...
未完待续
Python3
网络
爬虫
开发实战(9)
代理
的
使用
(需补充
代理
池
的
构建) ...
赞
踩
article
Springboot
计算机
毕业设计
追星
小
程序
【附源码】开题+论文+
mysql
+
程序
+部署_sprin...
最后,在用户管理方面,我们将实现用户注册、登录、个人信息管理等功能,同时结合用户的行为数据和兴趣偏好,提供个性化的推荐服...
赞
踩
article
Co
d
eforce
Deltix
Roun
d
,
Summer
2021 #D_
d
eltix roun...
博客介绍了如何在
Co
d
eforce
Deltix
Roun
d
Summer
2021的比赛中,利用不超过2n次询问,通过位运...
赞
踩
article
二叉树
OJ
题
...
例如我们cur位于节点4的时候是无法用后继指针指向节点6的,因为还没有获取到节点,但是如果我们到达节点6后prev就会到...
赞
踩
article
转
--
2014年最新810多套
android
源码
2.46GB免费一次性打包
下载
...
转
载自:http://www.eoe
android
.com/thread-497046-1-1.html感谢该博客主人无...
赞
踩
article
深入
理解
WKWebView
(入门篇)——
WebKit
源码
调试
与
分析
_
wkwebview
源码
...
百度Geek说 关注我们,带你了解更多百度技术干货。 67篇原创内容 ...
赞
踩
article
Python
| 分享8个
Excel
自动化
脚本
,
一定有你用得上的!_
ex
表格
脚本
...
本文将介绍8个常用的
Python
脚本
,
帮助你轻松应对
Excel
的日常操作。那话不多说
,
开始吧!_
ex
表格
脚本
ex
表格
脚本
...
赞
踩
article
张量
是
什么...
张量
是
什么?细分
张量
类别并从色彩角度理解
张量
_
张量
张量
...
赞
踩
article
IIS
_CVE-
2017
-
7269
IIS
6.0远程
代码执行
漏洞
复现——踩坑记...
一、
漏洞
描述
IIS
6.0默认不开启WebDAV,一旦开启了WebDAV,安装了
IIS
6.0的服务器将可能受到该
漏洞
的威...
赞
踩
article
解决
SQL
Server
Configuration
Manager
中
SQL
Server
(MSSQ...
因为要用到数据库,昨天打开 Microsoft
SQL
Server
Management Studio,发现登录不上数...
赞
踩
article
硅纪元
视角
|
GPT
-4o
mini
限时
免费
微调,每天200万
免费
token
_
gpt
免费
toke...
与此同时,IBM的研究人员提出了一种无需训练的AI方法,旨在减少LLMs中的幻觉现象,并推出了AI-Hilbert,这是...
赞
踩
article
SpringBoot整合
银联
支付
...
看完不懂你来喷我项目需要接入新的
支付
渠道:
银联
无跳转
支付
,花了点时间接入成功,这里发布一个踩坑记录吧,把过程中的问题都会...
赞
踩
article
Github2024
-05-20
开源
项目
周报
Top15
_
开源
周报...
本周GitHub趋势榜上有15个
开源
项目
脱颖而出,涵盖ChatGPT桌面应用、图像生成、媒体系统、智能对话机器人等领域。...
赞
踩
article
IIS6.0
文件
解析
漏洞
复现及原理
解析
_
iis
曾经出现过通过分号字符来截断
文件
名
的
漏洞
它会将
abc
...
本文介绍了
IIS6.0
的
文件
解析
漏洞
,详细讲解了
漏洞
原理,即IIS如何将'a.asp;
jpg
'视为'a.asp'执行。通...
赞
踩
article
mac
安装高
版本
git
(
更新
git
)_
mac
git
版本
升级
...
新下载的idea,此idea的
版本
较高,但是在工作发现这个
版本
的
git
存在一定漏洞会导致一些信息泄露问题。_
mac
gi...
赞
踩
相关标签
mysql
flink
flink cdc
bs
find-all
SAP
stm32
单片机
c++
平台
应用
控制
技术
信息
爬虫
spring boot
课程设计
leetcode
数据结构
ui
数据库
人工智能
百度
数据分析
架构