1.毕业论文需要检验多重共线性,异方差,自相关,内生性
在我认知范围内,多重共线性问题一直不是计量里的什么大问题,回归之前看看各变量之间的相关系数基本就可以确定是否需要进一步检验了,线性相关性比较高,那就直接剔除吧!异方差检验我也没有做过,我一般直接就用稳健标准差,从来不用一般标准差!至于自相关检验这个问题也是没有做过的!
我认为做什么检验和文章关系比较大!我做过一篇FDI的文章,里面采用FDI存量数据,存量数据肯定有很强自相关性,于是我就采用动态面板估计了,后来经过几个模型的比对发现,FDI存量的自相关性对回归结果影响很小。计量实证还是应该为自己的思想服务,检验越多、方法越复杂不见得就一定是好事!
2.举例说明什么是异方差性
异方差性(heteroscedasticity )是相对于同方差而言的。
所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数估计量不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数的进行有关显著性检验。对存在异方差性的模型可以采用加权最小二乘法进行估计。
异方差性的检测——white test 在此检测中,原假设为:回归方程的随机误差满足同方差性。对立假设为:回归方程的随机误差满足异方差性。
判断原则为:如果nr^2>chi^2 (k-1),则原假设就要被否定,即回归方程满足异方差性。在以上的判断式中,n代表样本数量,k代表参数数量,k-1代表自由度。
chi^2值可由查表所得。2含义 编辑 回归模型的随机扰动项ui在不同的观测值中的方差不等于一个常数,var(ui)= 常数(i=1,2,…,n),或者var(u ) var(u )(i j),这时我们就称随机扰动项ui具有异方差性(heteroskedasticity)。
在实际经济问题中,随机扰动项ui往往是异方差的,但主要在截面数据分析中出现。例如 (1)调查不同规模公司的利润,发现大公司的利润波动幅度比小公司的利润波动幅度大;(2)分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。
在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;图5-1显示了一元线性回归中随机变量的方差ui随着解释变量 的增加而变化的情况。异方差性破坏了古典模型的基本假定,如果我们直接应用最小二乘法估计回归模型,将得不到准确、有效的结果。
来源1.模型中缺少某些解释变量,从而随机扰动项产生系统模式 由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。
例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装、食品等)的需求,设其模型为:(5-1) 其中qi表示对某一消费品的需求量,ii为家庭收入,ui为随机扰动项。ui包括除家庭收入外其他因素对qi的影响。
如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得qi偏离均值的程度。在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平ii,qi偏离均值的程度是不同的,var(ui) 常数,于是就存在异方差性了。
再比如,以某一时间截面上不同地区的数据为样本,研究某行业的产出随投入要素的变化而变化的关系,建立如下模型:(5-2) 其中yi表示某行业的产出水平。li表示劳动力对产出的影响。
ki表示资本对产出的影响,ui表示除劳动力和资本外其他因素对产出水平的影响,诸如地理位置、国家政策等。显然,对于不同的行业 ,这些因素对产出 的影响程度是不 同的,引起 偏离零均值的程度也是不同的,这就出现了异方差。
异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。
2.测量误差 测量误差对异方差性的作用主要表现在两个方面:一方面,测量误差常常在一定时间内逐渐积累,误差趋于增加,如解释变量x越大,测量误差就会趋于增大;另一方面,测量误差可能随时间变化而变化,如抽样技术或收集资料方法的改进就会使测量误差减少。所以测量误差引起的异方差性一般都存在于时间序列中。
例如,研究某人在一定时期内学习打字时打字差错数yt与练习打字时间xt之间的关系。显然在打字练习中随时间的增加,打字差错数将减少,即随着xt的增加yt将减小。
这时var(ut)将随xt的增加而减少,于是存在异方差性。不仅在时间序列上容易出现异方差性,利用平均数作为样本数据也容易出现异方差性。
因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同,一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即var(ui)随收入ii呈现先降后升的趋势,这也存在着异方差性。3.模型函数形式设置不正确 模型函数形式的设定误差。
如将指数曲线模型误设成了线性模型,则误差有增大的趋势。4.异常值的出现 随机因素的影响,如政策变动、自然灾害、金融危机、战争和季节等。
类型 异方差一般可归结为三种类型:(1)单调递增型:随x的增大而增大,即在x与y的散点图中,表现为随着x值的增大y值的波动。
转载请注明出处众文网 » 毕业论文异方差(毕业论文需要检验多重共线性,异方差,自相关,内生性)