赞
踩
在线性回归中,常数项的作用常常被人忽略。
常数项什么意义?
别人都说没啥作用,你忽略即可。
忽略?为啥没作用啊?
就是没作用啦!
为啥没作用啊?
没作用就是没作用啊!
没作用给个理由撒?
没作用还给理由撒!
万事就怕细究,道听途说不是学术,别人说没用就没用了?搞学术不是谈恋爱,即使你忽略她,也得给出个理由。实际上,在特定的环境下,有着"惊人"的意义。今天雁君就从常数项的意义开始谈起,进而一起讨论下虚拟变量和固定效应的含义。
咱们先从经典的一元回归系数推导开始,别怕,咱们不讲闲言碎语!对于一个简单的一元回归模型
根据随机项的重要性质------零均值假设,即,我们可以从公式(1)看出,常数项就是自变量时因变量的预测值。那么常数项究竟有没有意义呢?我们看下伍德里奇的原话
截距是时y的预测值,尽管在有些情形中把设定为0并没有意义。在那些情形中,并没有什么值得关注的地方。
从伍先生的原文中可以看出,论及常数项是否有意义,它是有前提的。它的前提便是自变量有没有意义。如果在现实中对应的值域不包括0,那么此时常数项确实可以忽略,比如我们想研究年龄对工资的影响,此时作为自变量的年龄在现实中不可能为0,因为没有人会在刚生下来就工作;而投资组合中的$$系数本身就是一个常数项,它反映了投资回报中不被市场整体变动所影响的部分,亦即基金经理战胜大盘、获取超额回报的能力。因此,谈常数项的有无意义,一定要结合具体情况。
经济学有各种各样的论断,但无不对应着前提(假设),抛开假设谈某某主义的对错是一种荒谬无知的行为。
不谈前提就下结论,都是学阀流氓!
打倒学阀!!打倒流氓!!
说道虚拟变量,那我就不困了,虚拟变量之于计量经济学,那实在太精彩了,尤其研究社会热点问题,比如男女是否平权,比如去医院到底有没有效果,比如好男人都结婚了吗,这些牵扯到是否的问题,都需要用到虚拟变量,也就是01变量。如果涉及到的分组不止两种,比如肤色之于工资的影响,那可能要涉及多个01变量。注意,这里经常被初学者混淆,对于多个类别的虚拟变量的设置,比如三种肤色,你需要设置的不是012,而是两个0_1变量表示(相对于黑皮肤,你是不是黄皮肤;相对于黑皮肤,你是不是白皮肤)。这里的0就代表了基组,而所有的虚拟变量的含义,都是该组相对于基组的变化。对于虚拟变量,它的值域显然必然以及一定可以取到0,这时候我们的常数项就有意义了。
不得不提一句的是,男女性别问题设置一个虚拟变量(是不是男或者是不是女)已经完全可以识别分组,如果同时(是不是男)和(是不是女)两个虚拟变量,则会产生由"虚拟变量陷阱"所引发的共线性问题,因为对于特定个体而言,ta要么为男性,要么为女性,因此若同时设置两个虚拟变量,这两个虚拟变量取值之和只能为1。同理,三种肤色只需设置两个虚拟变量,而n个分类的情况也只需要设置n-1个虚拟变量。
仍然用伍德里奇课本上的例子,我们考虑受到相同教育水平下男女工资是否存在差异,亦即是否存在职场性别歧视的问题,建立如下计量模型
这里即是虚拟变量,0为否,即非女性(一般就是指男性 ),取1时即为女性。如果该变量显著,假设显著为负,那就意味着同等教育水平下女性工资少于男性,即可证明存在性别歧视问题。那么我们想问的是,这时候常数项是什么含义呢?
再回到公式(1),根据的假设,我们可以得到^1
从公式(3)中我们可以看到,常数项不仅是自变量时因变量的预测值,它还就等于因变量的观测值的均值!那么,回到性别歧视的例子,此时就是自变量时因变量的均值,用数学期望的形式表示为
这时候常数项的意义就很好理解了,就是男性的平均工资,只是在存在控制变量的情况下常数项值与男性工资均值稍有不同,如果没有控制变量则完全相同,这里不做数学上的过多讨论。
眼见为实,我们用stata对数据操作下。
事实上,我们可以在回归中只输入因变量,这时得到的就是的全样本(不分男女)均值
. use WAGE1.DTA,clear. reg wage Source │ SS df MS Number of obs = 526─────────────┼────────────────────────────────── F(0, 525) = 0.00 Model │ 0 0 . Prob > F = . Residual │ 7160.41429 525 13.6388844 R-squared = 0.0000─────────────┼────────────────────────────────── Adj R-squared = 0.0000 Total │ 7160.41429 525 13.6388844 Root MSE = 3.6931─────────────┬──────────────────────────────────────────────────────────────── wage │ Coef. Std. Err. t P>|t| [95% Conf. Interval]─────────────┼────────────────────────────────────
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。