天天看点

方差、标准差、均方误差的总结

方差

  百度百科中关于方差的解释为:(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。

  方差是衡量源数据和期望值相差的度量值。

  假设有一组离散的数据 xn=[x1,x2,x3,x4........xn] x n = [ x 1 , x 2 , x 3 , x 4 . . . . . . . . x n ] 。数据的均值: x¯¯¯=∑n1xin x ¯ = ∑ 1 n x i n ,则数据的方差为 var=∑n1(x−x¯¯¯)2n v a r = ∑ 1 n ( x − x ¯ ) 2 n 。

标准差

  标准差(Standard Deviation) ,又称为均方差,但是离均差平方的算术平均数的平方根。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

  标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。

  而标准差和方差具有开平方的关系,即 δ=var−−−√ δ = v a r

均方误差

  均方差与均方误差(mean squared error,MSE)不同,均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,用σ表示。均方误差可以用在机器学习中的损失函数,用于预测和回归。均方误差的公式为:

σ=∑n1(xi−xi‘)2n σ = ∑ 1 n ( x i − x i ‘ ) 2 n

   最后,三者关系为:

1、均方差就是标准差,标准差就是均方差

2、均方误差不同于均方误差

3、均方误差是各数据偏离真实值的距离平方和的平均数

继续阅读