上海涛德顾问学院

机器学习培训中方差分析F值的计算案例

摘要: 在机器学习的统计学习部分我们介绍了方差分析,其中的F值详细计算如下(下载附件,看F值计算的公式更清楚) F值的计算步骤: 包括: SST 全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况,是反应所 ...
机器学习的统计学习部分我们介绍了方差分析,其中的F值详细计算如下:

比如有100行样本(观测值),因子列为比如汽车颜色,不同的总颜色表示不同的因子水平,或者叫组), 因变量列(比如受颜色影响的销量)

F值的计算步骤:
SST
全部观察值(每个样本)       与总平均值    的离差平方和
反映全部观察值的离散状况,是反应所有样本数据波动情况的指标

计算SSE
每个水平或组的各样本数据与其组平均值的离差平方和
反映每个样本各观察值的离散状况,称为组内偏差平方和,或者组内离差平方和
该平方和反映的是随机误差的大小,又可以称为:误差平方和,误差项离差平方和

计算FSS
各组平均值                  与总平均值    的离差平方和
反映各总体的样本均值之间的差异程度,又称组间差异平方和,或者因子平方和,水平项离差平方和
该平方和既包括随机误差,也包括系统误差


三个平方和的关系(通过对SST分解可以证明)
总离差平方和(SST)、误差项离差平方和(ESS)、水平项离差平方和 (FSS) 之间的关系


SST = ESS + FSS


联系

上海涛德顾问学院 ( 沪ICP备14006824号 )  

GMT+8, 2018-12-11 11:11 , Processed in 0.167258 second(s), 19 queries , Gzip On.

Top Data World

回顶部