2.
误差项至关重要,因为它解释了独立变量无法解释的因变量的变化。因此,误差项的平均值应尽可能接近零,以使模型无偏。
3. 方程中的所有独立变量都与误差项不相关
如果独立变量与误差项之间存在相关性,则很容易预测误差项。这违反了误差项代表不可预测的随机误差的原则。因此,所有独立变量都不应与误差项相关。
4. 误差项的观测值也应该彼此没有关系
规则是这样的,对误差项 澳大利亚 whatsapp 数据 的一次观察不应该允许我们预测下一次观察。
5. 误差项应为同方差(方差为常数)
经典线性回归模型的这一假设意味着误差项的变化对于所有观测值都应该是一致的。绘制残差与拟合值图使我们能够检验这一假设。
6. 任何独立变量都不应该是其他变量的线性函数
当两个变量以固定比例变动时,这被称为完美相关性。例如,摄氏温度值的任何变化都会导致华氏温度值的相应变化。经典线性回归模型的这一假设表明,独立值之间不应存在直接关系。
最后的想法
我们已经了解了线性回归的概念以及确定因变量值时必须做出的线性回归假设。对于统计学来说,做出线性回归假设是必要的。如果这些假设正确,您将获得最佳估计值。在统计学中,产生方差最小、最无偏估计值的估计量被称为有效。
当所有假设成立时,经典线性回归模型是最有效的估计量之一。这个概念最好的方面是,随着样本量增加到无穷大,效率也会提高。为了更实际地理解这个概念,你应该看看线性回归面试问题。
最后,我们可以用统计学的简单定义来结束讨论。
“统计学是一门科学,两组有成就的科学家坐在一起分析同一组数据,但得出的结论却截然相反。”
如果您想在数据分析领域发展事业,请立即参加 使用 Excel 课程进行数据分析 。