方差(Variance)是数据集中值与样本集中值之间的差距程度的反映,是度量该数据集的离散程度的一种度量指标。要确定数据集的方差,首先必须要计算数据集中所有变量观测值的平均数,然后给出每个变量观测值与变量平均数之间的距离。
方差为正数,代表数据集中各数据出现频率衰减,各数据分布都是负偏;方差为负数,代表数据集中各数据出现频率增加,各数据分布都是正偏。0代表变量的值都等于平均数,没有任何方差。
由于数据集中有多个数据,方差也可以看作是所有数据分散程度的综合反映,可以把它看成样本内部涉及的数据离散程度的度量指标。正因为它可以反映样本内部的数据离散程度,所以一般来说,方差值越大,说明样本中数据的离散程度越大,且均数偏离越远。
方差有不同的计算公式,以均值为中心,以每一个变量观测值与它变量的平均数的差为分母,以变量个数数量乘积为分子,来计算方差:方差σ2=Σ(xi-μ)2/n
计算方差的过程有不同的方法,最简单的方法是使用计算机。通过 Excel 中的计算功能,输入数据,自动计算出数据集中的方差。
方差是常用的统计量概念,在统计学的研究分析中,方差都会给出重要的指导作用,它可以用来评估数据集的离散程度、判断平均数是否代表数据集、反映样本内部分布,以及仅通过观察数据而无需任何数据拟合函数去描述数据特征情况。另外,方差也是大多数传统和普遍中用到的误差估计指标之一。
TAG:方差是什么