搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
超简单的iPhone安装包的优化_ios安装包合规算法
2
本地部署属于自己的大语言模型和图文识别模型
3
DIY ROV系列(一)开篇_制作小型水下机器人(rov)详细教程
4
【ChatGPT 等国内大模型人工智能访问链接汇总】_kimichat基于什么大模型
5
nllb-200-distilled-600M语言缩写对照表
6
经典论文系列 | 重新思考在ImageNet上的预训练_imagenet预训练
7
fasttext论文笔记
8
针对Bert的改进,主要体现在增加训练语料、增添预训练任务、改进mask方式、调整模型结构、调整超参数、模型蒸馏等。_bert模型的各种改进
9
2023 - 2024 python 最新 毕业设计 选题推荐_python毕业设计选题
10
python情感分析预测模型_Python分词,情感分析工具 SnowNLP
当前位置:
article
> 正文
结构化风险最小、VC维到SVM的理解_srm中的vc维
作者:盐析白兔 | 2024-04-02 10:54:11
赞
踩
srm中的vc维
支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上。
置信风险: 分类器对 未知样本进行分类,得到的误差。
经验风险: 训练好的分类器,对训练样本重新分类得到的误差。即样本误差
结构风险:置信风险 + 经验风险
结构风险最小化就是为了防止过拟合而提出来的策略,贝叶斯估计中最大后验概率估计就是结构风险最小化的一个例子。当模型的条件概率分布、损失函数是对数损失函数、模型复杂度由模型先验概率表示时,结构风险最小化等价于最大后验概率估计。监督学习问题变成经验风险或结构风险函数的最优化问题,这时经验风险或结构风险函数是最优化的目标函数。
SVM在小样本训练集上能够得到比其它算法好很多的结果。支持向量机之所以成为目前最常用,效果最好的分类器之一,在于其优秀的泛化能力,这是是因为其本身的优化目标是结构化风险最小,而不是经验风险最小,因此,通过margin的概念,得到对数据分布的结构化描述,因此减低了对数据规模和数据分布的要求。
SVM也并不是在任何场景都比其他算法好,对于每种应用,最好尝试多种算法,然后评估结果。如SVM在邮件分类上,还不如逻辑回归、KNN、bayes的效果好。
VC维:将N个点进行分类,如分成两类,那么可以有2^N种分法,即可以理解成有2^N个学习问题。若存在一个假设H,能准确无误地将2^N种问题进行分类。那么这些点的数量N,就是H的VC维。 这个定义真生硬,只能先记住。一个实例就平面上3个点的线性划分的VC维是3. 而平面上 VC维不是4,是因为不存在4个样本点,能被划分成2^4 = 16种划分法,因为对角的两对点不能被线性划分为两类。更一般地,在r 维空间中,线性决策面的VC维为r+1。
置信风险的影响因素有: 训练样本数目和分类函数的VC维。训练样本数目,即样本越多,置信风险就可以比较小;VC维越大,问题的解的种类就越多,推广能力就越差,置信风险也就越大。因此,增加样本数,降低VC维,才能降低置信风险。
而一般的分类函数,需要提高VC维,即样本的特征数据量,来降低经验风险,如多项式分类函数。如此就会导致置信风险变高,结构风险也相应变高。过度学习即overfit,就是置信风险变高的缘故。
结构风险最小化SRM(structured risk minimize)就是同时考虑经验风险与结构风险。在小样本情况下,取得比较好的分类效果。
保证分类精度(经验风险)的同时,降低学习机器的 VC 维
,可以使学习机器在整个样本集上的期望风险得到控制,这应该就是SRM的原则。
当训练样本给定时,分类间隔越大,则对应的分类超平面集合的 VC 维就越小。(分类间隔的要求,对VC维的影响)
根据结构风险最小化原则,前者是保证经验风险(经验风险和期望风险依赖于学习机器函数族的选择)最小,而后者使分类间隔最大,导致 VC 维最小,实际上就是使推广性的界中的置信范围最小,从而达到使真实风险最小。
训练样本在线性可分的情况下,全部样本能被正确地分类(咦这个不就是传说中的yi*(w*xi+b))>=1的条件吗),即经验风险Remp 为 0 的前提下,通过对分类间隔最大化(咦,这个就是Φ(w)=(1/2)*w*w嘛),使分类器获得最好的推广性能。
对于线性不可分的状况,可以允许错分。即对于离群点降低分类间隔。将距离原来的分类面越远,离群就越严重,这个距离,可以用一个值--松弛变量来表示,只有离群点才有松弛变量。当然,要对这个值加以限制,即在最小化函数里,加入一个惩罚项,里面还有一个可以人为设定的惩罚项C。当C无限的大,那么就退化为硬间隔问题,不允许有离群点,问题可能无解。若C=0,无视离群点。有时C值需要多次尝试,获取一个较好的值。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/盐析白兔/article/detail/351955?site
推荐阅读
article
Transformer
中
注意力
层和逐位感知
前馈
层的分工与合作_
transform
前馈
网络
...
在
Transformer
架构中,自
注意力
机制主要用于捕捉全局上下文信息,而位置感知
前馈
层则是在自
注意力
提供的上下文基础上...
赞
踩
article
AI
外呼
机器人
系统
搭建
和
私有
云部署_
外呼
机器人
搭建
...
AI
外呼
机器人
系统
搭建
和
私有
云部署_
外呼
机器人
搭建
外呼
机器人
搭建
AI
外呼
机器人
系统
搭建
和
私有
云...
赞
踩
article
RBAC
权限
模型
(基于
角色
的
访问控制
)_基于
角色
的
访问控制
模型
...
一、前言
权限
一句话来理解就是对资源的控制,关于
权限
可以毫不客气的说几乎每个系统都会包含。只不过不同系统关于
权限
的应用复杂...
赞
踩
article
1、JAVA基础_
java
中怎么
判断
list
集合
第二条
对象
某个
字段的大于第一条...
接口和抽象类abstract 抽象类extends实现继承用super调用父类的方法interface 接口可以通过im...
赞
踩
article
CentOS
中
Hadoop
的
安装
配置
简略教程_
centos
安装
hadoop
...
http://主节点IP地址:808//cluster。重启三台电脑,重启后在终端Shell。中区分三台主机,修改其显示...
赞
踩
article
requests
案例实战:
post
方式使用
百度
翻译
_
编写
一个程序
,
处理
post
请求的方法
,
利用百...
import jsonimport
requests
##以
翻译
hello为例###输入查询词,在header处显示的是p...
赞
踩
article
python
读写
JSON
数据
_学会读写以
json
(
javascript
object
notatio...
问题你想读写
JSON
(JavaScript Object Notation)编码格式的
数据
。解决方案
json
模块提供了一...
赞
踩
article
centos
7
修改
ssh
端口
_更换
ssl
协议
端口
号
centos
...
vim /etc/
ssh
/
ssh
d_config增加 Port 60022查看SELinux开放给
ssh
使用的
端口
sem...
赞
踩
article
pytorch
实现
CNN
_
LSTM
_
Attention
_
DNN网络模型
_
cnn
_
lstm
_
atte...
pytorch
实现
CNN
_
LSTM
_
Attention
_
DNN网络模型
_
cnn
_
lstm
_
attention
pyth...
赞
踩
article
pytorch
版预训练CNN模型
Alexnet
-vggnet-
inception
-Resnet-De...
Alexnet
:model_urls = {‘
alexnet
’: ‘https://download.
pytorch
.o...
赞
踩
article
nano
开发板
torch
安装_
jetson
_
nano
_
devkit
_sd_
card
.
zip
...
nano
开发板有一段时间了,之前是刷的卖家提供的镜像,结果镜像cuda版本不能运行
torch
,于是我在官网上再找了新版本...
赞
踩
article
iOS
开发过程中常见
错误
问题
及
解决方案
...
错误
原因:ld: x duplicate symbol for architecture x86_64 clang: e...
赞
踩
article
爬虫实战(自用)
requests
模块、聚焦爬虫(
数据
解析)、
selenium
模块_
使用
request...
一、
requests
模块一、
爬取
搜狗首页的页面
数据
import
requests
# 指定url# 发起请求,
get
方法会...
赞
踩
article
程序
动态
切片
技术研究...
摘要
程序
切片
技术是一种重要的
程序
分析技术,广泛应用于
程序
的调试、测试与维护等领域。
程序
切片
主要通过寻找
程序
内部的相关特性...
赞
踩
article
怎么设置
html
编译
报错
,
html
5发布
iOS
编译
报错
...
Ld /Users/poss/Library/Developer/Xcode/DerivedData/wangpaini...
赞
踩
article
人工智能
之
深度
学习
笔记
—
—
每天
五分钟
快速
掌握
深度
学习
理论...
深度
学习
和机器
学习
有什么区别呢?最主要的区别就是模型的不同,
深度
学习
主要使用神经网络算法模型,而机器
学习
就不是了,我们前...
赞
踩
article
爬虫学习之
requests
模块
GET
方法
_
get
方法
具体包括哪些
模块
...
使用流程1 指定url,使用抓包工具,查看想要获取数据的rul确认参数发起数据请求'''破解百度翻译思路:1.使用浏览器...
赞
踩
article
深度学习
安装
笔记(一)利用
Anaconda
安装
pytorch
-GPU
版本
配置:
win10
+cud...
利用
Anaconda
安装
pytorch
-GPU
版本
配置:
win10
+
cuda9.2
_
cuda9.2
cuda9.2
...
赞
踩
article
Aixcoder
:
AI辅助
编程
工具...
aixcoder是一款基于深度学习人工智能技术的AI辅助
编程
工具。提供了一个由各个领域的专业代码训练出来的“虚拟
编程
专家...
赞
踩
article
每天
五分钟
深度
学习
:
神经网络
和
深度
学习
有什么样
的
关系?...
本文简单
的
看了一下
神经网络
,我们可以理解到随着
神经网络
的
层数增多,会从原始数据中提取出更加深刻
的
信息,以此来完成最终
的
目...
赞
踩
相关标签
transformer
深度学习
人工智能
机器人
服务器
RBAC
权限控制
鉴定权限
mysql
java
hadoop
centos
大数据
linux
ssh
CNN
LSTM
attention
dnn
ios
xcode
macos
ide
python