1.回归分析中,年度控制变量和行业控制变量如何设置?
一般是指多元回归中将年度变量和行业变量加入回归。
多元回归分析的X变量一般分为两种:解释变量和控制变量,解释变量往往是论文中作者希望关注的变量,而控制变量则是也可以影响Y变量、X变量,但是并不是作者需要研究的变量,但是为了研究的严谨必须也考虑。
打个比方,假设我的Y变量是看“工资”,我的研究希望探究“性别变量”怎样影响“工资”,可是这里就有两个问题:第一,工资是随着时间变化的,过去的工资因为经济发展比较低而现在的工资高,男女加入工作的比例也是随着时间变化的,现在女性工作的更多;第二,工资是根据行业不同的,而男女的行业分布也往往不同。因此,如果不控制“年份”和“行业”两个变量,许多结论就无从下。例如我不控制行业和年份,得出了“工资女性较低,女性被歧视”的结论,有人可能就会反驳——女性在的行业往往是注重安稳而工资较低的,女性偏好安稳,因此并不是工资上有女性歧视,而是行业不同而已。所以为了真的发现女性是否被歧视,我就需要控制行业。比如看教师行业男性女性工资是否有统计差距?金融业?……
那么怎么控制行业呢?如果只有一个行业还好,可是行业很多,我们一个一个更改数据库做单变量回归是很没有效率的,这时我们就用到了多元回归的一个特性,每一个系数的含义是说:“控制其他加入多元回归的解释变量不变,这个解释变量变动1单位,则Y变动系数个单位”,因此我们就直接将行业变量(对行业变量的处理往往是考虑N个行业就加入N个不同变量,它们都是0、1的虚拟变量,0是指在这个行业里,1是指不在)和年份变量(直接加入时间变量)加入多元回归就可以得出“控制行业和年份”下的性别对工资的影响系数了。这样,我再分析出来就不会受到质疑。
实现这种回归,大部分统计软件都可以,包括SPSS,在写公式的时候按照我上述的方法在回归中添加入这些变量就可以了。
转载请注明出处众文网 » 毕业论文控制变量(回归分析中,年度控制变量和行业控制变量如何设置?)