Top Banner
第第第 第第第第第第第第第 第第第 第第第第第第第第第
60

第二章 统计资料的整理与分析

Jan 03, 2016

Download

Documents

rooney-white

第二章 统计资料的整理与分析. 上一张. 下一张. 主 页. 退 出. 1 数理统计中的常用术语. 1.1 总体与样本 总体: 根据 研究目的 确定 的 研究对象 的全体称为 总体 (population) ; 个体: 总体中的每一个研究单位称为 个体 (individual) ; 样本: 依据一定方法由总体中抽取部分个体所组成的集合称为 样本 (sample) ; 有限总体: 含有 有限个个体 的总体称为 有限总体 ; 无限总体: 包含有 无限多个个体 的总体称为 无限总体 ;. 上一张. 下一张. 主 页. 退 出. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 第二章  统计资料的整理与分析

第二章 统计资料的整理与分析第二章 统计资料的整理与分析

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 2: 第二章  统计资料的整理与分析

1 1 数理统计中的常用术语数理统计中的常用术语 1.1 1.1 总体与样本总体与样本 总体:总体:根据根据研究目的研究目的确定确定的的研究对象研究对象的全体称为的全体称为总体总体

(population)(population) ;; 个体:个体:总体中的每一个研究单位称为总体中的每一个研究单位称为个体个体 (individua(individua

l)l) ;; 样本:样本: 依据一定方法由总体中抽取部分个体所组成的 依据一定方法由总体中抽取部分个体所组成的

集合称为集合称为样本样本 (sample)(sample) ;; 有限总体:有限总体:含有含有有限个个体有限个个体的总体称为的总体称为有限总体有限总体;; 无限总体:无限总体:包含有包含有无限多个个体无限多个个体的总体称为的总体称为无限总体无限总体;;

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 3: 第二章  统计资料的整理与分析

样本容量:样本容量:样本中所包含的个体数目样本中所包含的个体数目叫叫样本容量样本容量或或大小大小 (sample size)(sample size) ,,样本容量常记为样本容量常记为 nn 。通常把。通常把 nn≤30≤30的样本叫的样本叫小样本小样本,, n n >30>30 的样本叫的样本叫大大样本样本。。

试验研究的目的:了解总体,然而能试验研究的目的:了解总体,然而能观测到的却是样本,观测到的却是样本,通过样本来推断通过样本来推断总体是统计分析的基本特点总体是统计分析的基本特点。 。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 4: 第二章  统计资料的整理与分析

为了能可靠地从样本来推断总体,要求样本为了能可靠地从样本来推断总体,要求样本具有一定的具有一定的含量含量和和代表性代表性。。

如何获取有代表性的样本?采用随机抽取。 如何获取有代表性的样本?采用随机抽取。 所谓所谓随机抽取随机抽取 (random sampling) (random sampling) 是指总是指总

体中的每一个个体都有同等的机会被抽取到样本体中的每一个个体都有同等的机会被抽取到样本中。中。

样本毕竟只是总体的一部分,尽管样本具有样本毕竟只是总体的一部分,尽管样本具有一定的含量也具有代表性,通过样本来推断总体一定的含量也具有代表性,通过样本来推断总体也也不可能是百分之百的正确不可能是百分之百的正确。。有很大的可靠性但有很大的可靠性但有一定的错误率这是统计分析的特点有一定的错误率这是统计分析的特点。。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 5: 第二章  统计资料的整理与分析

1.2 1.2 参数与统计量参数与统计量 为了表示总体和样本的为了表示总体和样本的数量数量特征,需要计算特征,需要计算特特

征数征数。。

参数:参数:由由总体总体计算的特征数叫计算的特征数叫参数参数 (parameter)(parameter) ;;常用希腊字母表示参数,例如用常用希腊字母表示参数,例如用 μμ 表示总体平均表示总体平均数,用数,用 σσ 表示总体标准差;表示总体标准差;

统计量:统计量:由样本计算的特征数叫由样本计算的特征数叫统计量统计量 (staisti(staistic)c) 。常用拉丁字母表示统计量,例如用 表 示。常用拉丁字母表示统计量,例如用 表 示样本平均数,用样本平均数,用 ss 表示样本标准差,用表示样本标准差,用 RR 表示极表示极差。 差。

x

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 6: 第二章  统计资料的整理与分析

x

总体总体样本样本

参数参数 统计统计量量

ss

μ

σ

σ2 方 差 s2

标准差

平均数

R极 差

抽样抽样

推断、估计推断、估计

为了了解总体分布、特征为了了解总体分布、特征

构 造

Page 7: 第二章  统计资料的整理与分析

总体参数由相应的样本统计量来估计,总体参数由相应的样本统计量来估计,例如用 估计例如用 估计 μμ ,用,用 SS 估计估计 σσ 等。等。

1.3 1.3 准确性与精确性准确性与精确性 准确性准确性 (accuracy)(accuracy) 也叫也叫准确度准确度,,指观测指观测

值与其真值的接近程度。值与其真值的接近程度。设某一试验指标或设某一试验指标或性状的真值为性状的真值为 μμ ,观测值为,观测值为 xx ,若 ,若 xx 与与 μμ相差的绝对值相差的绝对值 ||xx -- μ|μ| 越小, 则观测值越小, 则观测值 xx 的的准确性越高; 反之则低。准确性越高; 反之则低。

x

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 8: 第二章  统计资料的整理与分析

精确性精确性 (precision)(precision) 也叫也叫精确度精确度,,指同一试验指指同一试验指

标或性状的重复观测值彼此接近的程度。标或性状的重复观测值彼此接近的程度。若观测值若观测值

彼此接近,即任意二个观测值彼此接近,即任意二个观测值 xxii 、、 xxjj 相差的绝对相差的绝对

值值 ||xxi i -- xxjj | | 越小,则观测值精确性越高;反之则低。越小,则观测值精确性越高;反之则低。

准确性、精确性的意义见图准确性、精确性的意义见图 2-12-1 。 。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张 图 2-1 准确性与精确性的关系示意图

Page 9: 第二章  统计资料的整理与分析

随机误差 随机误差 也叫 也叫 抽样误差 抽样误差 (sampling error) (sampling error) , , 是由于许多无法控制的内在和外在的是由于许多无法控制的内在和外在的偶然因素偶然因素所造成的 。随机误差带有偶然性质,在试验中,所造成的 。随机误差带有偶然性质,在试验中,即使十分小心的进行试验操作也难以消除。即使十分小心的进行试验操作也难以消除。随随机误差不可避免,但可减少。机误差不可避免,但可减少。

随机误差影响试验的精确性。随机误差影响试验的精确性。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

1.41.4 随机误差随机误差 (random error)(random error) 与系统误差与系统误差(systematic error)(systematic error)

Page 10: 第二章  统计资料的整理与分析

统计上的试验误差是指随机误差。这种统计上的试验误差是指随机误差。这种误差愈小,试验的精确性愈高。误差愈小,试验的精确性愈高。

系统误差 系统误差 也叫 也叫 片面误差 片面误差 (lopsided err(lopsided error)or) , 这是 由于试验对象相差较大,测量的, 这是 由于试验对象相差较大,测量的仪器不准 、 标准试剂未经校正,以及观测、仪器不准 、 标准试剂未经校正,以及观测、记载、抄录、计算中的错误等等所引起。记载、抄录、计算中的错误等等所引起。系系统误差可以通过改进方法、正确试验设计来统误差可以通过改进方法、正确试验设计来避免、消除。避免、消除。

系统误差影响试验的准确性。系统误差影响试验的准确性。下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 11: 第二章  统计资料的整理与分析

正确地进行试验数据资料的分类是统计资正确地进行试验数据资料的分类是统计资

料整理的前提。在调查或试验中,由观察、料整理的前提。在调查或试验中,由观察、

测量所得的数据资料按其性质的不同,一般测量所得的数据资料按其性质的不同,一般

可以分为可以分为数量性状资料、 质量性状资料和半数量性状资料、 质量性状资料和半

定量(等级)资料定量(等级)资料三大类。 三大类。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

2 2 统计资料的分类统计资料的分类

Page 12: 第二章  统计资料的整理与分析

数量性状数量性状 (quantitative character)(quantitative character) 是指是指能够以能够以

测量、计量或计数的方式表示其特征的性状测量、计量或计数的方式表示其特征的性状 。观察 。观察

测定数量性状而获得的数据就是测定数量性状而获得的数据就是数量性状资料数量性状资料

数量性状资料的获得有数量性状资料的获得有测量测量和和计数计数两种方式 ,因两种方式 ,因

而数量性状资料 又分为而数量性状资料 又分为计量资料计量资料和和计数资料计数资料两种。两种。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

2.1 2.1 数量性状资料数量性状资料

Page 13: 第二章  统计资料的整理与分析

2.2 2.2 质量性状资料质量性状资料

质量性状质量性状 (qualitative character)(qualitative character) 是指是指能观察能观察

到而不能直接测量的到而不能直接测量的,只能用,只能用文字来描述文字来描述其特征其特征

的性状,如食品颜色、 风味等等。这类性状本身的性状,如食品颜色、 风味等等。这类性状本身

不能直接用数值表示,要获得这类性状的数据资不能直接用数值表示,要获得这类性状的数据资

料,须对其观察结果料,须对其观察结果作数量化作数量化处理,其方法?处理,其方法?

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 14: 第二章  统计资料的整理与分析

2.3 2.3 半定量(等级)资料半定量(等级)资料 半定量或等级资料半定量或等级资料 (semi-quantitative or (semi-quantitative or

ranked data)ranked data) 是指将是指将观察单位观察单位按所考察的性状按所考察的性状

或指标的或指标的等级顺序分组等级顺序分组,然后,然后清点各组观察单清点各组观察单

位的次数位的次数而得的资料。这类资料既有次数资料而得的资料。这类资料既有次数资料

的特点,又有程度或量的不同。如某种果实的的特点,又有程度或量的不同。如某种果实的

褐变程度是视果实变色面积将其分组,然后统褐变程度是视果实变色面积将其分组,然后统

计各级别果数。计各级别果数。

Page 15: 第二章  统计资料的整理与分析

三种不同类型的资料相互间是有区别的,但三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。种类型资料转化成另一种类型的资料。

例如,酸奶中的乳杆菌总数得到的资料属例如,酸奶中的乳杆菌总数得到的资料属于计数资料,根据化验的目的,可按乳杆菌总于计数资料,根据化验的目的,可按乳杆菌总数正常或不正常分为两组,清点各组的次数,数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按计数资料就转化为质量性状次数资料;如果按乳杆菌总数过高、正常、过低分为三组 ,清点乳杆菌总数过高、正常、过低分为三组 ,清点各组次数 ,就转化成了半定量资料 。各组次数 ,就转化成了半定量资料 。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 16: 第二章  统计资料的整理与分析

3 3 数据资料的整理 数据资料的整理

3.1 3.1 数据资料的检查与核对数据资料的检查与核对 目的:目的:在于确保原始资料的在于确保原始资料的完整性完整性和和正确性正确性。。 所谓所谓完整性完整性是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。 所谓所谓正确性正确性是指原始资料的测量和记载无差错或是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐 ;有重复、异常或遗漏的资料 ,应予以删除或补齐 ;对有错误、相互矛盾的资料应进行更正,必要时进对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。行复查或重新试验。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,通过科学的整理和分析,可发现其规律性,揭示事物内在本质通过科学的整理和分析,可发现其规律性,揭示事物内在本质。

Page 17: 第二章  统计资料的整理与分析

3.53.5 统计表和统计图

统计表的结构和制作基本原则1. 标题:描述表格内容,包括研究对象和统计分析指标;2. 横标目:指研究对象,一个横标目对应一横行的内容;3. 纵标目:统计分析指标,一个纵标目对应一纵列的内容;4. 数字:数字右对齐,同一指标的小数位数一致;5. 线条:最简单的统计表为“三横线”,不允许有竖线;6. 备注:补充说明表格的内容。

原则:统计表要简单明了,重点突出

3.5.1 统计表

Page 18: 第二章  统计资料的整理与分析

统计表

Page 19: 第二章  统计资料的整理与分析

统计图选择合适的统计图的原则1. 根据资料分析的目的2. 根据资料的性质 数值变量资料:普通线图、直方图、散点 图分类资料:直条图、圆图、百分条图

Page 20: 第二章  统计资料的整理与分析

(一)普通线图 line diagram 定义:表示某事物在时间上的发展变化或某现象随另一现象变迁的情况。特点: 1. 纵横轴为算术尺度。 2. 相邻两点用线段连接(折线图)。

Page 21: 第二章  统计资料的整理与分析

绘制方法绘制方法

Page 22: 第二章  统计资料的整理与分析
Page 23: 第二章  统计资料的整理与分析

散点图 scatter diagram

定义:用点的密集程度和趋势表示两种现象的相关关系。

Page 24: 第二章  统计资料的整理与分析

直条图 bar graph

定义:用等宽直条的长短来表示相互独立的各指标的数值大小。

特点:1. 纵轴从 0 开始。2. 等宽直条,直条间

距相等。3. 按一定顺序(如高

低顺序)排列。

Page 25: 第二章  统计资料的整理与分析

工具 -加载宏 - 分析数据库 数据分析 方差分析 回归分析 统计假设检验 描述统计

EXCEL统计分析

Page 26: 第二章  统计资料的整理与分析

4.1 4.1 平均数(平均数( meanmean ,, average)average)

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

4 4 统计资料的特征数统计资料的特征数

平均数是统计学中最常用的统计量,反映数据资平均数是统计学中最常用的统计量,反映数据资料的相对集中位置。平均数主要包括有:料的相对集中位置。平均数主要包括有:

算术平均数算术平均数(( arithmetic meanarithmetic mean ))

中位数中位数(( medianmedian ) )

众数众数(( modemode ))

几何平均数几何平均数(( geometric meangeometric mean ))

调和平均数调和平均数(( harmonic meanharmonic mean ))

Page 27: 第二章  统计资料的整理与分析

4.1.1 4.1.1 算术平均数(算术平均数( arithmetic mean)arithmetic mean)

算术平均数算术平均数是指资料中各观测值的总和除以是指资料中各观测值的总和除以观测值个数所得的商,简称观测值个数所得的商,简称平均数或均数平均数或均数,记,记为 。为 。

算术平均数采用直接法计算。算术平均数采用直接法计算。

1.1. 直接法直接法

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

x

Page 28: 第二章  统计资料的整理与分析

设某一资料包含设某一资料包含 nn 个观测值: 个观测值: xx11 、、 xx22 、…、、…、 xxnn ,, 则样本平均数可通过下式计算: 则样本平均数可通过下式计算:

(( 2-12-1)) 其中,其中, ΣΣ为总和符号; 表示从第一个观测值为总和符号; 表示从第一个观测值 xx

11累加到第累加到第 nn 个观测值个观测值 xxnn 。当 在意义上已明确时,。当 在意义上已明确时,可简写为可简写为 ΣΣxx ,(,( 3-13-1)式可改写为: )式可改写为:

n

x

n

xxxx

n

ii

n

121

n

iix

1

n

xx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

n

iix

1

Page 29: 第二章  统计资料的整理与分析

例:对食品科学专业例:对食品科学专业 20042004 级级 11班班 1010 位同学的体重进行测定,测位同学的体重进行测定,测定结果分别为定结果分别为 50.050.0 、、 52.052.0 、、 53.553.5、、 56.056.0 、、 58.558.5、、 60.060.0 、、 48.48.00 、、 51.051.0 、、 50.550.5、、 49.049.0(( kgkg ),求其平均数。),求其平均数。

由于 由于 ΣΣxx=50.0+=50.0+52.0+53.5+56.0+58.5 52.0+53.5+56.0+58.5

+60.0+48.0+51.0+50.5+49.0+60.0+48.0+51.0+50.5+49.0 =528.5=528.5,, nn=10=10

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

5(kg)8.5210

5.528∑

n

xx

1010 位同学的平均体重为位同学的平均体重为 52.85 52.85 kgkg 。。

Page 30: 第二章  统计资料的整理与分析
Page 31: 第二章  统计资料的整理与分析

3.3. 平均数的基本性质平均数的基本性质

(( 11)样本各观测值与平均数之)样本各观测值与平均数之差的和差的和为零,为零,

即即离均差离均差之和等于零之和等于零。 。

或简写成或简写成0)(

1

xxn

ii 0)( xx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 32: 第二章  统计资料的整理与分析

(( 22)样本各观测值与平均数之差的平方和为最)样本各观测值与平均数之差的平方和为最

小,即小,即离均差平方和为最小离均差平方和为最小。。

((xxii- )- )2 2 < (< (xxii- a- a))22 (常数(常数 a≠ a≠ ))

或简写为: 或简写为: <<

对于对于总体总体而言,通常用而言,通常用 μμ 表示总体平均数,有表示总体平均数,有

限总体的平均数为: 限总体的平均数为:

n

i 1x

n

i 1

2)( xx 2)( x

NxN

ii

1

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

x

(( 2-32-3))

式中,式中, NN表示总体所包含的个体数表示总体所包含的个体数

Page 33: 第二章  统计资料的整理与分析

统计学中常用样本平均数( )作为总体平统计学中常用样本平均数( )作为总体平

均数(均数( μμ)的估计量,并已证明样本平均数)的估计量,并已证明样本平均数

是总体平均数是总体平均数 μμ 的无偏估计量。的无偏估计量。

当一个统计量的当一个统计量的数学期望(数学意义上的均数学期望(数学意义上的均

值)值)等于所估计的总体参数时,则称此统计量等于所估计的总体参数时,则称此统计量

为该总体参数的为该总体参数的无偏估计量无偏估计量。。

x

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 34: 第二章  统计资料的整理与分析

4.1.2 4.1.2 中位数中位数 ( ( medianmedian)) 将资料内所有观测值由小到大依次排列,将资料内所有观测值由小到大依次排列,

位于中间的那个观测值,称为中位数,记位于中间的那个观测值,称为中位数,记为为 MMdd 。。

当观测值的个数是偶数时,则以中间两当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得个观测值的平均数作为中位数。当所获得的数据资料呈的数据资料呈偏态分布偏态分布时,中位数的代表时,中位数的代表性优于算术平均数。 性优于算术平均数。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 35: 第二章  统计资料的整理与分析

(( 11)当观测值个数)当观测值个数 nn 为奇数时,第为奇数时,第 ((n+n+1)1)/2/2位置的观测值,即位置的观测值,即 x(n+x(n+11)/2)/2 为中位数:为中位数:

MMdd==

(( 22)当观测值个数为 偶 数 时 , 第)当观测值个数为 偶 数 时 , 第 n/2n/2 和和

第(第( n/2+1n/2+1)位置的两个观测值之和的)位置的两个观测值之和的 1/21/2

为中位数,即:为中位数,即:

2/)1( nx

2)12/(2/

nnd

xxM

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

(( 2-42-4 ))

Page 36: 第二章  统计资料的整理与分析

【例】 对【例】 对 99个小麦品种的容重进行测定,测个小麦品种的容重进行测定,测定结果为定结果为 750 750 、 、 760760 、 、 767767、 、 769769、、 773773 、、775775、、 778778、、 780780 、、 800800(已排序),求其(已排序),求其中位数。中位数。

此例 此例 nn=9=9,为奇数,则: ,为奇数,则:

MMdd= =773= =773(( gg))

即九个小麦品种的中位数为即九个小麦品种的中位数为 773 g773 g 。 。

52/)19(2/)1( xxx n

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 37: 第二章  统计资料的整理与分析

4.1.3 4.1.3 几何平均数(几何平均数( geometric meangeometric mean )) n n 个观测值相乘之积开 个观测值相乘之积开 n n 次方所得的方根,称为次方所得的方根,称为几何平均数几何平均数,记为,记为 GG。。它主要应用于科学研究中的动它主要应用于科学研究中的动态分析,如微生物的增长率、人口的增长率等等态分析,如微生物的增长率、人口的增长率等等。当。当观测值呈几何级数变化时,用几何平均数比用算术平观测值呈几何级数变化时,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下:均数更能代表其平均水平。其计算公式如下:

nn

nn xxxxxxxxG

1

)( 321321

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

(2-6)(2-6)

Page 38: 第二章  统计资料的整理与分析

为了计算方便,可将各观测值取对数后相加为了计算方便,可将各观测值取对数后相加

除以除以 nn ,得,得 lgGlgG,再求,再求 lgGlgG的反对数,即得的反对数,即得 GG

值,即值,即

)]lglg(lg1[lg 211

nxxxn

G

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 39: 第二章  统计资料的整理与分析

4.1.4 众 数(mode) 资料中出现次数最多的那个观测值或资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为次数最多一组的组中值,称为众数,记为MM00 。。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

4.1.5 4.1.5 调和平均数(调和平均数( harmonic mean)harmonic mean) ,,资料中各观测值资料中各观测值倒数倒数的 算术平均数 的 算术平均数

的的倒数倒数,称为调和平均数,称为调和平均数,记为,记为 HH,即,即

xnxxxn n

H111111

1

)(

1

21 (( 2—82—8 ))

计算平均速率计算平均速率

Page 40: 第二章  统计资料的整理与分析

4.2 变异数

变异数的意义

用平均数作为样本的代表,其用平均数作为样本的代表,其代表性的强代表性的强弱弱受样本资料中各观测值受样本资料中各观测值变异程度变异程度的影响。的影响。仅用平均数对一个资料的特征作统计描述是仅用平均数对一个资料的特征作统计描述是不全面的,还需引入度量资料中观测值变异不全面的,还需引入度量资料中观测值变异程度大小的统计量。程度大小的统计量。

常用的表示变异程度的统计量有常用的表示变异程度的统计量有全距全距、、方差方差、、标准差标准差和和变异系数变异系数。。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 41: 第二章  统计资料的整理与分析

4.2.1 4.2.1 全距(全距( RangeRange )) 全距(极差)全距(极差)是表示资料中各观测值变异程度是表示资料中各观测值变异程度

大小最简便的统计量。大小最简便的统计量。

RR== Max-MinMax-Min

RR 值越大,平均数的代表性越差。但是全距只值越大,平均数的代表性越差。但是全距只利用了资料中的最大值和最小值,没有充分利利用了资料中的最大值和最小值,没有充分利用全部资料,并不能准确表达资料中各观测值用全部资料,并不能准确表达资料中各观测值的变异程度,是的变异程度,是比较粗略比较粗略的。当资料很多而又的。当资料很多而又要迅速对资料的变异程度作出判断时,可以利要迅速对资料的变异程度作出判断时,可以利用用全距全距这个统计量。 这个统计量。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 42: 第二章  统计资料的整理与分析

为 了 准 确 地 表示样本内各个观测值的为 了 准 确 地 表示样本内各个观测值的变异程度 ,人们 首 先会考虑到以平均数为变异程度 ,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,( 标准,求出各个观测值与平均数的离差,( ) ,称为 ) ,称为离均差离均差。。

虽然离均差能表示一个观测值偏离平均数的虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负 ,性质和程度,但因为离均差有正、有负 ,离均差之和为零,即离均差之和为零,即 Σ = 0 Σ = 0 ,因 而 不 能 ,因 而 不 能 用离均差之和用离均差之和 ΣΣ ( )来 表 示 资料中所( )来 表 示 资料中所有观测值的有观测值的总偏离程度总偏离程度。 。

xx

xx

xx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

4.2.2 方差(Variance)

Page 43: 第二章  统计资料的整理与分析

为了解决离均差有正 、有负,离均差为了解决离均差有正 、有负,离均差之和为零的问 题 , 可先求 离 均 差的之和为零的问 题 , 可先求 离 均 差的绝 对 值绝 对 值 并 将 各 离 均 差 绝对 值 之 和 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数 除以 观 测 值 个 数 n n 求 得 求 得 平 均 绝 对 平 均 绝 对 离差离差,即,即 ΣΣ| |/n| |/n 。虽然平均绝对离差。虽然平均绝对离差可以表示资料中各观测值的变异程度 ,可以表示资料中各观测值的变异程度 ,但由于平均绝对离差包含但由于平均绝对离差包含绝对值符号 ,绝对值符号 ,使用很不方便使用很不方便,在统计学中未被采用。,在统计学中未被采用。

xx

Page 44: 第二章  统计资料的整理与分析

采用将离均差平方的办法来解决离均差有正、采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。有负,离均差之和为零的问题。

先将各 个离 均差平方,即 先将各 个离 均差平方,即 ( )( )22 ,再求 ,再求 离均差平方和 离均差平方和 , 即 ,简称, 即 ,简称平方和平方和,记为,记为SSSS ; 由 于 离差平方和 常 随 样 本 大 小 而 改 ; 由 于 离差平方和 常 随 样 本 大 小 而 改 变 ,为 了 消 除 样 本大小 的 影 响 , 用平方变 ,为 了 消 除 样 本大小 的 影 响 , 用平方和 除 以 样 本 大 小, 即 ,求出离均差和 除 以 样 本 大 小, 即 ,求出离均差平方和的平均数 ;平方和的平均数 ;

xx 2)( xx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

nxx /)( 2

Page 45: 第二章  统计资料的整理与分析

为了使所得的统计量是相应总体参数的无 偏估计为了使所得的统计量是相应总体参数的无 偏估计量,量,统计学证明统计学证明,在求离均差平方和的平均数时,,在求离均差平方和的平均数时,分母分母不用样本含量不用样本含量 nn ,而,而用自由度 用自由度 n-n-11 , 所以,我, 所以,我们 采 用统计量 表示资料的变异程度。们 采 用统计量 表示资料的变异程度。

统计量 称 为 统计量 称 为 均 方均 方 ( ( mean squamean squarere缩写为缩写为 MSMS)) ,, 又称又称样本方差样本方差,记为,记为 SS22 ,即,,即, VAVARR

SS22= = (( 2—92—9 ) )

)( 1/)( 2 nxx

)( 1/)( 2 nxx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

)( 1/)( 2 nxx

Page 46: 第二章  统计资料的整理与分析

相应的总体参数叫 相应的总体参数叫 总体方差 总体方差 ,记为,记为σσ22 。对于有限总体而言,。对于有限总体而言, σσ22 的计算公的计算公式为:式为:

(( 2—102—10))Nxx /)( 22

Page 47: 第二章  统计资料的整理与分析

统计学上把统计学上把样本方差样本方差 SS2 2 的平方根叫做的平方根叫做样本样本标准 差标准 差,记为,记为 SS ,即:,即: STDEVSTDEV

1

)( 2

n

xxS

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

4.2.3 4.2.3 标准差(标准差( Stand deviation)Stand deviation)

(( 2-112-11))

Page 48: 第二章  统计资料的整理与分析

由于 由于

所以(所以( 2-112-11 )式可改写为: )式可改写为:

)2()( 222xxxxxx

22 2 xnxxx 2

22 )(

)(2

n

xn

n

xx

n

xx

22 )(

1

2)(2

n

xS n

x

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 49: 第二章  统计资料的整理与分析

相应的总体参数叫相应的总体参数叫总体标准差总体标准差,记为,记为

σσ 。对于有限总体而言,。对于有限总体而言, σσ 的计算公式为:的计算公式为:

(( 2-122-12))

在统计学中,在统计学中,常用样本标准差常用样本标准差 SS 估计估计

总体标准差总体标准差 σσ 。 。

Nx /)( 2

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 50: 第二章  统计资料的整理与分析

4.2.4 4.2.4 标准差的计算方法标准差的计算方法

1. 1. 直接法直接法 可直接利用定义公式来计算标准差。可直接利用定义公式来计算标准差。

Page 51: 第二章  统计资料的整理与分析

【例】 【例】 1010瓶罐头的净重(瓶罐头的净重( gg)分别为)分别为 450450 , , 450450 , , 500500 , , 500500 , , 500500 ,, 550550 , , 550550 , , 550550 , , 600600 , , 600600 ,, 650650 ,计算标准差。 ,计算标准差。

由已知,计算:由已知,计算: ΣΣxx=5400=5400 ,, ΣΣxx22=295500=29550000 ,代入公式得:,代入公式得:

1010瓶罐头净重的标准差为瓶罐头净重的标准差为 65.828 g65.828 g 。。

828.65110

10/54002955000

1

/)( 222

n

nxxS

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

(g)(g)

Page 52: 第二章  统计资料的整理与分析

3. 3. 标准差的特性标准差的特性

(( 11))标准差的大小,受资料中每个观测值的影响,如标准差的大小,受资料中每个观测值的影响,如

观测值间变异观测值间变异大,求得的标准差也大,反之则小。大,求得的标准差也大,反之则小。

(( 22))计算标准差时,在各观测值加上或减去一个常数,计算标准差时,在各观测值加上或减去一个常数,

其数值不变。其数值不变。

(( 33))每个观测值乘以或除以一个常数每个观测值乘以或除以一个常数 aa ,则所得的标,则所得的标

准差是原来标准差的准差是原来标准差的 aa倍或倍或 11/a/a倍。 倍。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 53: 第二章  统计资料的整理与分析

(( 44 ))在资料服从正态分布的条件下,资料在资料服从正态分布的条件下,资料中约有中约有 68.26%68.26%的观测值在平均数左右一倍的观测值在平均数左右一倍标准差( 标准差( ±S±S)范围内;约有)范围内;约有 95.43%95.43%的的观测值在平均数左右两倍标准差( 观测值在平均数左右两倍标准差( ±2±2SS)范围内;约有)范围内;约有 99.73%99.73%的观测值在平均的观测值在平均数左右三倍标准差( 数左右三倍标准差( ±3S±3S) 范 围内。) 范 围内。也就是说也就是说全距近似地等于全距近似地等于 66 倍标准差,倍标准差,可用可用(全距(全距 /6/6 )来粗略估计标准差。 )来粗略估计标准差。

x

xx

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 54: 第二章  统计资料的整理与分析

用 SPSS 软件实现统计描述

Page 55: 第二章  统计资料的整理与分析

n

和平方偏差平方和=平方和

n

XXXXSS

2i2

i2

i

)(-=)(=

熟 记熟 记

Page 56: 第二章  统计资料的整理与分析

4.2.5 4.2.5 变异系数变异系数 Coefficient of variation)Coefficient of variation)

变异系数是衡量资料中各观测值变异 变异系数是衡量资料中各观测值变异 程度的另一个统计量 。程度的另一个统计量 。

标 准差与平均数的比值标 准差与平均数的比值称为 称为 变异系数变异系数,,记为记为 C·VC·V 。。

变异系数可以消除单位 和 (或)平 变异系数可以消除单位 和 (或)平 均数的影响,可以比较均数的影响,可以比较不同样本不同样本资料的资料的相对变异程度相对变异程度。。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 57: 第二章  统计资料的整理与分析

变异系数的计算公式为:变异系数的计算公式为:

%100x

SVC

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

性状 x/μm S/μm CV/ %果皮厚 49.6 4.9 9.9

角质层厚 6.2 0.8 12.9

(( 2—132—13))

表表 2-8 2-8 赞皇大枣果皮厚、角质层厚测量结果赞皇大枣果皮厚、角质层厚测量结果

角质层相对变异程度大角质层相对变异程度大

Page 58: 第二章  统计资料的整理与分析

指 标 平均值 标准差 变幅 变异系数%

物理性状

水分 % 13.00 0.67 11.75-14.50 5.18

容重 g/L 766.0 25.0 694-843 3

百粒重 g 34.48 5.97 14.59-44.86 17.30

百粒体积 ml 28.06 4.87 11.0-35.8 17.34

籽粒密度 g/ml1.23 0.03 1.14-1.33 2.81

营养品质

淀粉 % 69.55 1.35 63.82-72.06 1.95

粗蛋白 % 10.97 0.92 8.63-13.88 8.39

粗脂肪 % 4.51 1.16 2.89-9.69 25.63

灰分 % 1.46 0.11 1.20-1.78 7.38

粗纤维 % 2.19 0.29 1.58-2.85 13.31

Page 59: 第二章  统计资料的整理与分析

注意:变异系数的大小,同时受平均注意:变异系数的大小,同时受平均

数和标准差两个统计量的影响,因而数和标准差两个统计量的影响,因而

在利用变异系数表示资料的变异程度在利用变异系数表示资料的变异程度

时,最好将平均数和标准差也列出。时,最好将平均数和标准差也列出。

下一张 下一张 主 页 主 页 退 出 退 出 上一张 上一张

Page 60: 第二章  统计资料的整理与分析

思考题思考题

总体、样本、参数、统计量的概念及其关系总体、样本、参数、统计量的概念及其关系 精确性、准确性、随机误差、系统误差的概念精确性、准确性、随机误差、系统误差的概念及其关系及其关系

如何计算平均数、方差、标准差、变异系数,如何计算平均数、方差、标准差、变异系数,其意义、性质是什么其意义、性质是什么

软件计算平均数、方差、标准差软件计算平均数、方差、标准差