A. 数据的集中趋势和离散趋势测度的指标有哪些,各自的表达式是什么
集中趋势测度的指标有算术均数,几何均数,中位数和百分位数。表达式是平均数的概念,它能够对总体的某一特征具有代表性,表明所研究的舆论现象在一定时间、空间条件下的共同性质和一般水平。
离散趋势测度的指标有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。表达式是各个变量值远离其中心值的程度,是数据分布的另一个重要特征。
(1)离散趋势指标包括扩展阅读:
离散趋势标准差:
平均差用绝对值来度量,虽然避免了正负离差的相互抵消,但不便于运算。一般情况下,可用方差来度量一组数据的离散性。方差通常用字母σ2来表示。
为了使统计量的单位同观察值的单位相一致,通常将方差开平方,即得到标准差σ,标准差也称为均方差。由定义可知,方差和标准差所反映的是一组数据对其均值为代表的中心的某种偏离程度。从定义可知,标准差(或方差)较小的分布一定是比较集中在均值附近的,反之则是比较分散的。
标准差的缺点是计算起来比较麻烦。标准差也是根据全部数据来计算的,但是它也会受到极端值的影响。标准差的计算要比平均差方便,因此,标准差是描述数据离散趋势最常用的统计量。
在统计中我们通常用sigma^2和sigma分别表示总体的方差和标准差。当总体中的个体数很大,希望通过抽样,用样本标准差来估计总体的标准差时,就需要计算样本的方差和标准差。仅需要对总体方差和标准差的计算公式作一些调整即可。
标准差的概念在统计上具有重要的作用。对于任意一个总体,在确定了标准差以后,就可以精确地确定总体中的单位落在平均数两侧某个范围内的频率大小。对于正态分布的情形,在下一小节中,我们将介绍数据落在某个特定范围内概率的大小及其意义。