標準差大小說明什么
標準差的概念比較簡單,它代表一組數值和平均值相比分散開來的程度。也就是說,標準差大代表大部分的數值和平均值差異比較大,標準差小代表這組數字比較接近平均值。
標準差的計算公式我給你放在了附錄里,公式看上去稍微復雜一點,但主要就是算每一個數據和平均值之間的差異距離。你經常聽說某市平均薪資是 X 萬,你很納悶我和周邊人薪資這么少,為啥平均薪資那么高,我是怎么“被漲薪”的?我們可以看一下下面這個例子,假如兩個小組的月薪大概是如下這個樣子,單位都是“萬”。
第一組:[1.72,1.70,1.68,1.71,1.69] ;第二組:[1.70,5.20,0.60,0.2,0.8]。
這兩組人你可以簡單計算一下,你會發(fā)現平均月薪都是 1 萬 7。但很明顯,第 2 組人的薪酬高低差異要比第 1 組人大很多。第一組人都是 1 萬 7 左右的薪資,差異不大。你很不巧在第二組里,你月薪 6000,周邊都是 2000、8000 的小伙伴,但是實際上,你這組里有月薪 5 萬的人你不認識,于是,你就“被漲薪”了。
通過公式或者 Excel 函數(我在最后一章會教你如何方便地計算),你能算出來第一組標準差是 0.014,第二組是 1.818,差異能有一百多倍。如果每次只給你某地區(qū)或者某部門的平均薪酬,但是不告訴你這個地區(qū)部門它的標準差有多大,那我們難免就會覺得困惑,“不患寡而患不均”用在這里依舊很合適。
你不僅需要知道一個平均值,同時還需要知道一個標準差
所以看薪資的時候,,你才能知道整體薪資水平、你自己的水平以及你將來的天花板在哪里。
但是只有這個概念還不夠,假設對于第 1 組的薪資單位來說,我用的是不是“萬元”,而是用“百元”甚至“元”作為單位的話,它的標準差就會到 1.414 和 141.4。這個時候再和第 2 組人員去比,感覺好像標準差的離散度更高,但是實際數據卻不是如此。
離散系數 = 標準差 / 平均值
所以一般我們真的在做數據分析的時候,我們會常用另外一個數據來規(guī)避這種問題,它叫做離散系數 CV(coefficient of variation)。它的計算公式很簡單,就是用標準差除以平均值(),這樣的話就規(guī)避了單位或者其他因素的這些差異。我們直接看離散系數這個數據,就能知道這幾組數據之間的離散程度和差異是什么樣的。
下次你再去問人力資源部門的平均薪酬的時候,你可以多問一句“這個部門的離散系數有多少?”你大概就會知道,你可以要到最高多少的薪酬和你將來的漲薪空間會有多大了。
附錄:方差及標準差公式