均值,衆數,中位數,标稱差:
- 均值是就全部資料計算的,它具有優良的數學性質,是實際中應用最廣泛的集中趨勢測度值.其主要缺點是易受資料極端值的影響,對于偏态分布的資料,均值的代表性較差.作為均值變形的調和平均數和幾何平均數,是适用于特殊資料的代表值,調和平均數主要用于不能直接計算均值的資料,幾何平均數則主要用于計算比率資料的平均數,這兩個測度值與均值一樣易受極端值的影響.
一般代表算術平均值。也就是:

比如
- 衆數是一組資料分布的峰值,是一種位置代表值.其優點是易于了解,不受極端值的影響.當資料的分布具有明顯的集中趨勢時,尤其是對于偏态分布,衆數的代表性比均值要好.其缺點是具有不唯一性,對于一組資料可能有一個衆數,也可能有兩個或多個衆數,也可能沒有衆數.
mode代表密度函數最大的點。***上的說明:Mode (statistics)。衆數是一組資料中出現次數最多的那個數。
- 中位數是一組資料中間位置上的代表值.其特點是不受資料極端值的影響.對于具有偏态分布的資料,中位數的代表性要比均值好.
在一組排好序資料中,資料數量為奇數,則中值為中間的那個數。 如果資料數量為偶數,則中值為中間的那兩個數值的平均值。
舉例: 中值能揭示平均值掩蓋的真相。 比如在某個國企中,如果最高上司層的工資極高,大部分職工工資比較低的情況下,中值則比較低。
看一組資料,比較一下均值,衆數和中值的不同。
類型 | 描述 | 例子 | 結果 |
---|---|---|---|
算術均值Arithmetic mean | 資料和除以資料的數量: | (1+2+2+3+4+7+9) / 7 | 4 |
中值Median | 中間的那個值,把資料分成大小兩半 | 1, 2, 2, 3, 4, 7, 9 | 3 |
衆數Mode | 頻度最大的那個數 | 1, 2, 2, 3, 4, 7, 9 | 2 |
看一下下面的兩種對數正态分布中三個值的情況。
- 标準差(Standard Deviation),在機率統計中最常使用作為統計分布程度(statistical ... 一個較大的标準差,代表大部分數值和其平均值之間差異較大;一個較小的标準差,代表 ... 标準差數值越大,代表回報遠離過去平均數值,回報較不穩定故風險越高。
标準偏差,計算公式為:
其中均值為
在機率統計中最常使用作為統計分布程度(statistical dispersion)上的測量。标準差定義是總體各機關标準值與其平均數離差平方的算術平均數的平方根。它反映組内個體間的離散程度。
标準計算公式:
假設有一組數值X1,X2,X3,......XN(皆為實數),其平均值(算術平均值)為μ,
标準差也被稱為标準偏差,或者實驗标準差,公式為
。