当前位置:   article > 正文

上焦如雾实际上是指何项作用_常数项、虚拟变量与固定效应

线性回归模型中为什么要引入常数项的

常数项、虚拟变量与固定效应

在线性回归中,常数项的作用常常被人忽略。

常数项什么意义?

别人都说没啥作用,你忽略即可。

忽略?为啥没作用啊?

就是没作用啦!

为啥没作用啊?

没作用就是没作用啊!

没作用给个理由撒?

没作用还给理由撒!

万事就怕细究,道听途说不是学术,别人说没用就没用了?搞学术不是谈恋爱,即使你忽略她,也得给出个理由99ea27fae68af628bded41fc528854d6.png。实际上,在特定的环境下,有着"惊人"的意义。今天雁君就从常数项的意义开始谈起,进而一起讨论下虚拟变量和固定效应的含义。

1、常数项的意义

咱们先从经典的一元回归系数推导开始,别怕,咱们不讲闲言碎语!对于一个简单的一元回归模型

根据随机项的重要性质------零均值假设,即,我们可以从公式(1)看出,常数项就是自变量时因变量的预测值。那么常数项究竟有没有意义呢?我们看下伍德里奇的原话

截距是时y的预测值,尽管在有些情形中把设定为0并没有意义。在那些情形中,并没有什么值得关注的地方。

从伍先生的原文中可以看出,论及常数项是否有意义,它是有前提的。它的前提便是自变量有没有意义。如果在现实中对应的值域不包括0,那么此时常数项确实可以忽略,比如我们想研究年龄对工资的影响,此时作为自变量的年龄在现实中不可能为0,因为没有人会在刚生下来就工作;而投资组合中的$$系数本身就是一个常数项,它反映了投资回报中不被市场整体变动所影响的部分,亦即基金经理战胜大盘、获取超额回报的能力。因此,谈常数项的有无意义,一定要结合具体情况。

经济学有各种各样的论断,但无不对应着前提(假设),抛开假设谈某某主义的对错是一种荒谬无知的行为。

不谈前提就下结论,都是学阀流氓!

打倒学阀!!beefab6dbba499f4f956bacd44116ac5.png打倒流氓!!beefab6dbba499f4f956bacd44116ac5.png

2 虚拟变量与常数项

说道虚拟变量,那我就不困了,虚拟变量之于计量经济学,那实在太精彩了,尤其研究社会热点问题,比如男女是否平权,比如去医院到底有没有效果,比如好男人都结婚了吗,这些牵扯到是否的问题,都需要用到虚拟变量,也就是01变量。如果涉及到的分组不止两种,比如肤色之于工资的影响,那可能要涉及多个01变量。注意,这里经常被初学者混淆,对于多个类别的虚拟变量的设置,比如三种肤色,你需要设置的不是012,而是两个0_1变量表示(相对于黑皮肤,你是不是黄皮肤;相对于黑皮肤,你是不是白皮肤)。这里的0就代表了基组,而所有的虚拟变量的含义,都是该组相对于基组的变化。对于虚拟变量,它的值域显然必然以及一定可以取到0,这时候我们的常数项就有意义了。

不得不提一句的是,男女性别问题设置一个虚拟变量(是不是男或者是不是女)已经完全可以识别分组,如果同时(是不是男)和(是不是女)两个虚拟变量,则会产生由"虚拟变量陷阱"所引发的共线性问题,因为对于特定个体而言,ta要么为男性,要么为女性,因此若同时设置两个虚拟变量,这两个虚拟变量取值之和只能为1。同理,三种肤色只需设置两个虚拟变量,而n个分类的情况也只需要设置n-1个虚拟变量。

仍然用伍德里奇课本上的例子,我们考虑受到相同教育水平下男女工资是否存在差异,亦即是否存在职场性别歧视的问题,建立如下计量模型

这里即是虚拟变量,0为否,即非女性(一般就是指男性 074cfa5fb9246ae1f0dc3d009a76fffe.png),取1时即为女性。如果该变量显著,假设显著为负,那就意味着同等教育水平下女性工资少于男性,即可证明存在性别歧视问题。那么我们想问的是,这时候常数项是什么含义呢?

再回到公式(1),根据的假设,我们可以得到^1

从公式(3)中我们可以看到,常数项不仅是自变量时因变量的预测值,它还就等于因变量的观测值的均值!那么,回到性别歧视的例子,此时就是自变量时因变量的均值,用数学期望的形式表示为

这时候常数项的意义就很好理解了,就是男性的平均工资,只是在存在控制变量的情况下常数项值与男性工资均值稍有不同,如果没有控制变量则完全相同,这里不做数学上的过多讨论。

眼见为实,我们用stata对数据操作下。

事实上,我们可以在回归中只输入因变量,这时得到的就是的全样本(不分男女)均值

. use WAGE1.DTA,clear. reg wage      Source │       SS           df       MS      Number of obs   =       526─────────────┼──────────────────────────────────   F(0, 525)       =      0.00       Model │           0         0           .   Prob > F        =         .    Residual │  7160.41429       525  13.6388844   R-squared       =    0.0000─────────────┼──────────────────────────────────   Adj R-squared   =    0.0000       Total │  7160.41429       525  13.6388844   Root MSE        =    3.6931─────────────┬────────────────────────────────────────────────────────────────        wage │      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]─────────────┼────────────────────────────────────
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/829906
推荐阅读
相关标签
  

闽ICP备14008679号