A. 數據的集中趨勢和離散趨勢測度的指標有哪些,各自的表達式是什麼
集中趨勢測度的指標有算術均數,幾何均數,中位數和百分位數。表達式是平均數的概念,它能夠對總體的某一特徵具有代表性,表明所研究的輿論現象在一定時間、空間條件下的共同性質和一般水平。
離散趨勢測度的指標有全距、異眾比率、四分位差、平均差、標准差以及離散系數,其中標准差最重要。表達式是各個變數值遠離其中心值的程度,是數據分布的另一個重要特徵。
(1)離散趨勢指標包括擴展閱讀:
離散趨勢標准差:
平均差用絕對值來度量,雖然避免了正負離差的相互抵消,但不便於運算。一般情況下,可用方差來度量一組數據的離散性。方差通常用字母σ2來表示。
為了使統計量的單位同觀察值的單位相一致,通常將方差開平方,即得到標准差σ,標准差也稱為均方差。由定義可知,方差和標准差所反映的是一組數據對其均值為代表的中心的某種偏離程度。從定義可知,標准差(或方差)較小的分布一定是比較集中在均值附近的,反之則是比較分散的。
標准差的缺點是計算起來比較麻煩。標准差也是根據全部數據來計算的,但是它也會受到極端值的影響。標准差的計算要比平均差方便,因此,標准差是描述數據離散趨勢最常用的統計量。
在統計中我們通常用sigma^2和sigma分別表示總體的方差和標准差。當總體中的個體數很大,希望通過抽樣,用樣本標准差來估計總體的標准差時,就需要計算樣本的方差和標准差。僅需要對總體方差和標准差的計算公式作一些調整即可。
標准差的概念在統計上具有重要的作用。對於任意一個總體,在確定了標准差以後,就可以精確地確定總體中的單位落在平均數兩側某個范圍內的頻率大小。對於正態分布的情形,在下一小節中,我們將介紹數據落在某個特定范圍內概率的大小及其意義。