赞
踩
思维导图:https://www.processon.com/view/link/5c6e214fe4b03334b523f836
Logistic回归为概率型非线性回归模型,是研究二分类观察结果与一些影响因素
之间关系的一种多
变量分析方法。经典的二分类算法,也可转换为多分类:
面试三问:(关于线性回归原理的三个问题【逻辑回归同】)
1.为什么要引入似然函数?
因为各个条件独立,又处于同一分布下,在样本数足够大的情况下,损失大小符合正态分布,预测函数输出等于真实值的几率,符合正态分布函数。将所有输入值成为真实值的概率相乘,得到最大似然函数。
2.为什么要用log对数?
相乘变相加,极大化简运算
3.为什么对数并化简后,要让右边式子越小越好?
左边函数的值一定为正数,忽略。右边的值一定为负数,因此化简为让一下公式最小。(最小二乘法)
逻辑回归进行分类时,不仅给出分类类别,而且还给出了预测概率,在二分类问题中,若(2)式y>0.5则被归为1类,小于0.5被归为0类。二项逻辑回归的条件概率为:
则二分类时,y=1,为P(Y=1)式,Y=0为下式。
完成后导入对数似然函数(同线性回归)
该表达式越大,成为1的可能性就越大,引入负号转换为梯度下降问题
对西塔(那个0中间加个杠的符号)求偏导,有几个西塔就求几次偏导。我们用j代替表示是第一个西塔
原函数=输入的值是线性预测的值,输出的是y的概率值
导数越大,y=1和y=0的可能性分开的大,分类越准确
https://blog.csdn.net/szu_hadooper/article/details/78619001
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。