8 - 8 - 1 计计 统计计 统 STAT STAT ISTICS ISTICS ( 计计计 计计计 ) 作作 作作作作 作作作作作作作 作作作 :, 统 作作 作作作作 作作作作作作作 作作作 :, 统 计 计 8 8 计 计计计计 计 计计计计 计计 计计计计计计 计计计 统 : 计计 计计计计计计 计计计 统 : 计计计 计计计 作作 统
Jan 01, 2016
8 - 8 - 11
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
第 第 8 8 章 假设检验章 假设检验
作者:中国人民大学统计学院作者:中国人民大学统计学院
贾俊平贾俊平
统计学
8 - 8 - 22
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
第 第 8 8 章 假设检验章 假设检验
8.18.1 假设检验的基本问题 假设检验的基本问题 8.28.2 一个总体参数的检验一个总体参数的检验8.38.3 两个总体参数的检验两个总体参数的检验8.48.4 检验问题的进一步说明检验问题的进一步说明
8 - 8 - 33
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
学习目标学习目标
1.1. 了解假设检验的基本思想 了解假设检验的基本思想 2.2. 掌握假设检验的步骤掌握假设检验的步骤3.3. 对实际问题作假设检验对实际问题作假设检验4.4. 利用置信区间进行假设检验利用置信区间进行假设检验5.5. 利用利用 P P - - 值进行假设检验值进行假设检验
8 - 8 - 44
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
8.1 8.1 假设检验的基本问题假设检验的基本问题
8.1.1 8.1.1 假设问题的提出假设问题的提出8.1.2 8.1.2 假设的表达式假设的表达式8.1.3 8.1.3 两类错误两类错误8.1.4 8.1.4 假设检验的流程假设检验的流程8.1.5 8.1.5 利用利用 PP 值进行决策值进行决策8.1.6 8.1.6 单侧检验单侧检验
8 - 8 - 55
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
假设问题的提出假设问题的提出
8 - 8 - 66
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
什么是假设什么是假设 ??((hypothesishypothesis))
对总体参数的的数值所作的一种陈述对总体参数的的数值所作的一种陈述 总体参数包括总体参数包括总体均值总体均值、、比例比例、、方差方差等等 分析分析之前之前必需陈述必需陈述
8 - 8 - 77
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
什么是假设检验什么是假设检验 ?? ((hypothesis testinghypothesis testing))
1.1. 事先对总体参数或分布形式作出某种假事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是设,然后利用样本信息来判断原假设是否成立否成立
2.2. 有参数假设检验和非参数假设检验有参数假设检验和非参数假设检验3.3. 采用逻辑上的反证法,依据统计上的小采用逻辑上的反证法,依据统计上的小
概率原理概率原理
8 - 8 - 88
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
提出原假设和备择假设提出原假设和备择假设
什么是原假设?什么是原假设? (null hypothesis)(null hypothesis)
1.1. 待检验的假设,又称“待检验的假设,又称“ 00 假设”假设”2.2. 研研究者想收集证据予以反对的假设究者想收集证据予以反对的假设3.3. 总是有等号 总是有等号 , , 或或4.4. 表示为 表示为 HH00
HH00 :: 某一数值 某一数值 指定为 指定为 = = 号,即 号,即 或 或 例如例如 , H, H00 :: 31903190 (克)(克)
8 - 8 - 99
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
什么是备择假设?什么是备择假设? (alternative hypothesis)(alternative hypothesis)
1.1. 与原假设对立的假设,也称“研究假设”与原假设对立的假设,也称“研究假设”2.2. 研究研究者者者者者者者者者者者者者者者者者者者者者者者者者者总是有不等号总是有不等号 :: ,, 或 或 3.3. 表示为 表示为 HH11
HH11 :: << 某一数值,或某一数值,或某一数值某一数值 例如例如 , H, H11 :: < 3910(< 3910( 克克 )) ,或,或者者
提出原假设和备择假设提出原假设和备择假设
8 - 8 - 1010
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
假设检验中的两类错误假设检验中的两类错误
(( 决策风险决策风险 ))
8 - 8 - 1111
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
假设检验中的两类错误假设检验中的两类错误
1.1. 第一类错误(弃真错误)第一类错误(弃真错误) 原假设为真时拒绝原假设原假设为真时拒绝原假设 会产生一系列后果会产生一系列后果 第一类错误的概率为第一类错误的概率为
被称为显著性水平被称为显著性水平2.2. 第二类错误(取伪错误)第二类错误(取伪错误)
原假设为假时接受原假设原假设为假时接受原假设 第二类错误的概率为第二类错误的概率为 (B(B
eta)eta)
8 - 8 - 1212
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
假设检验的流程假设检验的流程 提出假设提出假设 确定适当的检验统计量确定适当的检验统计量
规定显著性水平规定显著性水平
计算检验统计量的值计算检验统计量的值 作出统计决策作出统计决策
8 - 8 - 1313
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
什么是检验统计量?什么是检验统计量?1.1. 用于假设检验决策的统计量用于假设检验决策的统计量2.2. 选择统计量的方法与参数估计相同,需考选择统计量的方法与参数估计相同,需考
虑虑 是大样本还是小样本是大样本还是小样本 总体方差已知还是未知总体方差已知还是未知
3.3. 检验统计量的基本形式为检验统计量的基本形式为
确定适当的检验统计量确定适当的检验统计量
n
XZ
0
n
XZ
0
8 - 8 - 1414
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
规定显著性水平规定显著性水平((significant levelsignificant level))
什么是显著性水平?什么是显著性水平?1.1. 是一个概率值是一个概率值2.2. 原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域被称为抽样分布的拒绝域
3.3. 表示为 表示为 (alpha)(alpha) 常用的 常用的 者者者者 0.01, 0.05, 0.100.01, 0.05, 0.10
4.4. 由研究者事先确定由研究者事先确定
8 - 8 - 1515
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
作出统计决策作出统计决策
1.1. 计算检验的统计量计算检验的统计量2.2. 根据给定的显著性水平根据给定的显著性水平者者者者者者者者者者者者者者者者者者者者者者 zz 者者 zz
者者 tt 者者 tt
3.3. 将检验统计量的值与将检验统计量的值与者者者者者者者者者者者者者者者者者者者者4.4. 得出拒绝或不拒绝原假设的结论得出拒绝或不拒绝原假设的结论
8 - 8 - 1616
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
利用利用 PP 值进行决策值进行决策
8 - 8 - 1717
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
什么是什么是 P P 值值 ??((PP-value)-value)
1.1. 是一个概率值是一个概率值2.2. 如果原假设为真,如果原假设为真, P-P- 值是抽样分布中大值是抽样分布中大
于或小于样本统计量的概率于或小于样本统计量的概率 左侧检验时,左侧检验时, PP-- 值为曲线上方值为曲线上方小于等于小于等于检检
验统计量部分的面积验统计量部分的面积 右侧检验时,右侧检验时, PP-- 值为曲线上方值为曲线上方大于等于大于等于检检
验统计量部分的面积验统计量部分的面积3.3. 被称为观察到的被称为观察到的 (( 或实测的或实测的 )) 显著性水平显著性水平
HH00 能被拒绝的最小值能被拒绝的最小值
8 - 8 - 1818
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
双侧检验的双侧检验的 P P 值值
// 2 2 // 2 2
ZZ
拒绝拒绝 拒绝拒绝
HH00 值值HH00 值值临界值临界值临界值临界值
计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量 计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值临界值
1/2 1/2 P P 值值1/2 1/2 P P 值值1/2 1/2 P P 值值1/2 1/2 P P 值值
8 - 8 - 1919
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
左侧检验的左侧检验的 P P 值值
HH00 值值HH00 值值临界值临界值临界值临界值
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域
抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平
计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量
P P 值值P P 值值
8 - 8 - 2020
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
右侧检验的右侧检验的 P P 值值
HH00 值值HH00 值值临界值临界值临界值临界值
拒绝域拒绝域拒绝域拒绝域
抽样分布抽样分布抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平置信水平置信水平
计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量
P P 值值P P 值值
8 - 8 - 2121
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
利用 利用 P P 值进行检验值进行检验(( 决策准则决策准则 ))
1.1. 单侧检验单侧检验 若若 p-p- 值 值 ,, 不拒绝 不拒绝 HH00
若若 p-p- 值 值 < < , , 拒绝 拒绝 HH00
2.2. 双侧检验双侧检验 若若 p-p- 值 值 , , 不拒绝 不拒绝 HH00
若若 p-p- 值 值 < < , , 拒绝 拒绝 HH00
8 - 8 - 2222
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
双侧检验和单侧检验双侧检验和单侧检验
8 - 8 - 2323
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
双侧检验与单侧检验双侧检验与单侧检验 (( 假设的形式假设的形式 ))
假设研究的问题
双侧检验 左侧检验 右侧检验
H0 = =
H1 ≠≠ < < > >
8 - 8 - 2424
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
双侧检验双侧检验(( 原假设与备择假设的确定原假设与备择假设的确定 ))
1.1. 属于属于决策中的假设检验决策中的假设检验2.2. 不论是拒绝不论是拒绝 HH00 还是不拒绝还是不拒绝 HH00 ,都必需采取,都必需采取
相应的行动措施相应的行动措施3.3. 例如,某种零件的尺寸,要求其平均长度为例如,某种零件的尺寸,要求其平均长度为
10cm10cm ,大于或小于,大于或小于 10cm10cm 均属于不合格均属于不合格 我们想要证明我们想要证明 (( 检验检验 )) 大于或小于这两种可能大于或小于这两种可能
性中的任何一种是否成立性中的任何一种是否成立4.4. 建立的原假设与备择假设应为建立的原假设与备择假设应为 HH00: : 10 H 10 H11: : 10 10
8 - 8 - 2525
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
双侧检验双侧检验(( 显著性水平与拒绝域 显著性水平与拒绝域 ))
抽样分布抽样分布抽样分布抽样分布
HH00 值值HH00 值值临界值临界值临界值临界值临界值临界值临界值临界值
/2 /2 /2/2 /2/2
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域 拒绝域拒绝域拒绝域拒绝域
1 - 1 - 1 - 1 -
置信水平置信水平置信水平置信水平
8 - 8 - 2626
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
单侧检验单侧检验(( 显著性水平与拒绝域显著性水平与拒绝域 ))
HH00 值值临界值临界值
样本统计量样本统计量
拒绝域拒绝域
抽样分布抽样分布
1 - 1 -
置信水平置信水平
8 - 8 - 2727
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
8.2 8.2 一个总体参数的检验一个总体参数的检验
8.2.1 8.2.1 检验统计量的确定检验统计量的确定8.2.2 8.2.2 总体均值的检验总体均值的检验8.2.3 8.2.3 总体比例的检验总体比例的检验8.2.4 8.2.4 总体方差的检验总体方差的检验
8 - 8 - 2828
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
一个总体参数的检验一个总体参数的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
8 - 8 - 2929
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
者者者者均值检验均值检验
8 - 8 - 3030
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
总体均值的检验总体均值的检验(( 检验统计量检验统计量 ))
总体 是否已知?
总体 是否已知?
用样本标
准差 S 代替
用样本标
准差 S 代替
t 检验 t 检验
nS
Xt 0
nS
Xt 0
小小小小样本量 n样本量 n
否否否否是是是是
z 检验
z 检验
n
XZ
0
n
XZ
0
z 检验z 检验
nS
XZ 0
nS
XZ 0
大大大大
8 - 8 - 3131
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
总体均值的检验总体均值的检验 ((22 已知或已知或 22 未知大样本未知大样本 ))
1.1. 假定条件假定条件 总体服从正态分布总体服从正态分布 若不服从正态分布若不服从正态分布 , , 可用正态分布来近似可用正态分布来近似 ((nn
30)30)
2.2. 使用使用 ZZ-- 统计量统计量 22 已知:已知:
22 未知:未知:
)1,0(~0 Nn
XZ
)1,0(~0 Nn
XZ
)1,0(~0 NnS
XZ
)1,0(~0 N
nS
XZ
8 - 8 - 3232
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 已知均值的检验已知均值的检验(( 例题分析例题分析 ))
【例】【例】 某机床厂加工一种零件,根某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值度近似服从正态分布,其总体均值为为 00=0.081mm=0.081mm ,总体标准差为,总体标准差为 = =
0.0250.025 。今换一种新机床进行加工。今换一种新机床进行加工,抽取,抽取 nn=200=200 个零件进行检验,得个零件进行检验,得到的椭圆度为到的椭圆度为 0.0760.076mmmm 。试问新机。试问新机床加工零件的椭圆度的均值与以前床加工零件的椭圆度的均值与以前有无显著差异?(有无显著差异?(== 0.050.05 ))
双侧检验双侧检验
8 - 8 - 3333
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 已知均值的检验已知均值的检验 (( 例题分析例题分析 ))
HH00:: = 0.081 = 0.081
HH11: : 0.081 0.081
== 0.050.05
nn == 200200
临界值临界值 (s):(s):
检验统计量检验统计量 ::
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
有证据表明新机床加工的零件有证据表明新机床加工的零件的椭圆度与以前有显著差异的椭圆度与以前有显著差异
83.2200025.0
081.0076.00
n
xz
83.2200025.0
081.0076.00
n
xz
8 - 8 - 3434
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 已知均值的检验已知均值的检验 ((P P 值的计算与应用值的计算与应用 ))
第第 11 步:步:进入进入 ExcelExcel 表格界面,选择“插入”下拉菜表格界面,选择“插入”下拉菜单单第第 22 步:步:选择“函数”点击选择“函数”点击第第 33 步:步:在函数分类中点击“统计”,在函数名的菜在函数分类中点击“统计”,在函数名的菜 单下选择字符“单下选择字符“ NORMSDISTNORMSDIST”” 然后确定然后确定第第 44 步:步:将将 ZZ 的绝对值的绝对值 2.832.83 录入,得到的函数值为录入,得到的函数值为 0.9976725370.997672537
PP 值值 =2(1=2(1 -- 0.997672537)=0.0046540.997672537)=0.004654
PP 值远远小于值远远小于,故拒绝,故拒绝 HH00
8 - 8 - 3535
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 已知均值的检验已知均值的检验 (( 小样本例题分析小样本例题分析 ))
【例】【例】 根据过去大量资料,根据过去大量资料,某厂生产的灯泡的使用寿命某厂生产的灯泡的使用寿命服从正态分布服从正态分布 N~N~((10201020 ,, 10100022)) 。现从最近生产的一批产。现从最近生产的一批产品中随机抽取品中随机抽取 1616 只只,测得样,测得样本平均寿命为本平均寿命为 10801080 小时。试小时。试在在 0.050.05 的显著性水平下判断的显著性水平下判断这批产品的使用寿命是否有这批产品的使用寿命是否有显著提高?显著提高? (( == 0.050.05))
单侧检验单侧检验
8 - 8 - 3636
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 已知均值的检验已知均值的检验 (( 小样本例题分析小样本例题分析 ))
HH00:: 1020 1020
HH11: : > 1020 > 1020
== 0.050.05
nn == 1616
临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高
决策决策::
结论结论::
4.216100
102010800
n
xz
4.216100
102010800
n
xz
ZZ00
拒绝域拒绝域
0.050.05
1.6451.645
8 - 8 - 3737
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知大样本均值的检验未知大样本均值的检验 (( 例题分析例题分析 ))
【例】【例】某电子元件批量生产的某电子元件批量生产的质量标准为平均使用寿命质量标准为平均使用寿命 12001200小时。某厂宣称他们采用一种小时。某厂宣称他们采用一种新工艺生产的元件质量大大超新工艺生产的元件质量大大超过规定标准。为了进行验证,过规定标准。为了进行验证,随机抽取了随机抽取了 100100 件作为样本,件作为样本,测得平均使用寿命测得平均使用寿命 12451245 小时小时,标准差,标准差 300300 小时。能否说该小时。能否说该厂生产的电子元件质量显著地厂生产的电子元件质量显著地高于规定标准? 高于规定标准? (( == 0.050.05))
单侧检验单侧检验
8 - 8 - 3838
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知大样本均值的检验未知大样本均值的检验 (( 例题分析例题分析 ))
HH00: : 1200 1200
HH11: : >1200 >1200
== 0.050.05
n n == 100100
临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于 12001200 小时小时
决策决策::
结论结论::
5.1100300
120012450
n
xz
5.1100300
120012450
n
xz
ZZ00
拒绝域拒绝域
0.050.05
1.6451.645
8 - 8 - 3939
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
总体均值的检验总体均值的检验 ((22 未知小样本未知小样本 ))
1.1. 假定条件假定条件 总体为正态分布总体为正态分布 22 未知,且小样本未知,且小样本
2.2. 使用使用 tt 统计量统计量
)1(~0
ntnS
Xt
)1(~0
nt
nS
Xt
8 - 8 - 4040
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知小样本均值的检验未知小样本均值的检验 (( 例题分析例题分析 ))
【例】【例】 某机器制造出的肥某机器制造出的肥皂厚度为皂厚度为 55cmcm ,今欲了解,今欲了解机器性能是否良好,随机机器性能是否良好,随机抽取抽取 1010 块肥皂为样本,测块肥皂为样本,测得平均厚度为得平均厚度为 5.35.3cmcm ,标,标准差为准差为 0.30.3cmcm ,试以,试以 0.050.05的显著性水平检验机器性的显著性水平检验机器性能良好的假设。 能良好的假设。
双侧检验双侧检验
8 - 8 - 4141
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知小样本均值的检验未知小样本均值的检验 (( 例题分析例题分析 ))
HH00: : = 5 = 5
HH11:: 5 5
= 0.05= 0.05
df df = 10= 10 - 1 = 9 - 1 = 9临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH
00
说明该机器的性能不好说明该机器的性能不好
决策:决策:
结论:结论:
16.3103.0
53.50
ns
xt
16.3
103.0
53.50
ns
xt
tt00 2.2622.262-2.262-2.262
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
8 - 8 - 4242
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知小样本均值的检验未知小样本均值的检验 ((P P 值的计算与应用值的计算与应用 ))
第第 11 步:步:进入进入 ExcelExcel 表格界面,选择“插入”下拉菜单表格界面,选择“插入”下拉菜单第第 22 步:步:选择“函数”点击选择“函数”点击,并,并在函数分类中点击“统在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符计” ,然后,在函数名的菜单中选择字符 “ “TDISTTDIST”” ,确定,确定第第 33 步:步:在弹出的在弹出的 XX栏中录入计算出的栏中录入计算出的 tt 值值 3.16 3.16 在自由度在自由度 ((Deg-freedomDeg-freedom))栏中录入栏中录入 99 在在 TailsTails栏中录入栏中录入 22 ,表明是双侧检验,表明是双侧检验 (( 单测单测 检验则在该栏内录入检验则在该栏内录入 11))
PP 值的结果为值的结果为 0.01155<0.0250.01155<0.025,,拒绝拒绝 HH00
8 - 8 - 4343
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
22 未知小样本均值的检验未知小样本均值的检验 (( 例题分析例题分析 ))
【例】【例】一个汽车轮胎制造商声称一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件一定的汽车重量和正常行驶条件下下大于大于 4000040000 公里,对一个由公里,对一个由 2020个轮胎组成的随机样本作了试验个轮胎组成的随机样本作了试验,测得平均值为,测得平均值为 4100041000 公里,标公里,标准差为准差为 50005000 公里。已知轮胎寿命公里。已知轮胎寿命的公里数服从正态分布,我们能的公里数服从正态分布,我们能否根据这些数据作出结论,该制否根据这些数据作出结论,该制造商的产品同他所说的标准相符造商的产品同他所说的标准相符?? (( = 0.05= 0.05))
单侧检验!单侧检验!
8 - 8 - 4444
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
均值的单尾 均值的单尾 t t 检验 检验 (( 计算结果计算结果 ) )
HH00: : 40000 40000
HH11:: < 40000 < 40000
= 0.= 0.0505
df df = = 20 - 1 = 1920 - 1 = 19
临界值临界值 (s):(s):
检验统计量检验统计量 ::
在在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
不能认为制造商的产品同他所不能认为制造商的产品同他所说的标准不相符说的标准不相符
决策决策 ::
结论结论 ::
894.0205000
4000041000
0
ns
xt
894.0205000
4000041000
0
ns
xt
-1.7291-1.7291 tt00
拒绝域拒绝域
.05.05
8 - 8 - 4545
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
总体比例的检验总体比例的检验((ZZ 检验检验 ))
8 - 8 - 4646
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
一个总体比例检验一个总体比例检验
1.1. 假定条件假定条件 有两类结果有两类结果 总体服从二项分布总体服从二项分布 可用正态分布来近似可用正态分布来近似
2.2. 比比例检验的 例检验的 Z Z 统计量统计量
00 为假设的总体比例为假设的总体比例
)1,0(~)1( 00
0 N
n
PZ
)1,0(~)1( 00
0 N
n
PZ
8 - 8 - 4747
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
一个总体比例的检验一个总体比例的检验 (( 例题分析例题分析 ))
【例】【例】 一项统计结果声称,一项统计结果声称,某市老年人口(年龄在某市老年人口(年龄在 6565 岁岁以上)的比重为以上)的比重为 14.714.7%% ,该,该市老年人口研究会为了检验该市老年人口研究会为了检验该项统计是否可靠,随机抽选了项统计是否可靠,随机抽选了400400 名居民,发现其中有名居民,发现其中有 5757人年龄在人年龄在 6565 岁以上。调查结岁以上。调查结果是否支持该市老年人口比重果是否支持该市老年人口比重为为 14.7%14.7% 的看法?的看法? ((= = 0.050.05))
双侧检验双侧检验
8 - 8 - 4848
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
一个总体比例的检验一个总体比例的检验 (( 例题分析例题分析 ))
HH00:: = 14.7% = 14.7%
HH11: : 14.7% 14.7%
= 0.05= 0.05
nn = = 400400
临界值临界值 (s):(s):
检验统计量检验统计量 ::
在在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
该市老年人口比重为该市老年人口比重为 14.7%14.7%
决策决策 ::
结论结论 ::
254.0
400
)147.01(147.0
147.01425.0
z 254.0
400
)147.01(147.0
147.01425.0
z
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
8 - 8 - 4949
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
总体方差的检验总体方差的检验((2 2 检验检验 ))
8 - 8 - 5050
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
方差的卡方差的卡方 方 ((22)) 检验检验
1.1. 检验一个总体的方差或标准差检验一个总体的方差或标准差2.2. 假设总体近似服从正态分布假设总体近似服从正态分布3.3. 检验统计量检验统计量
样本方差样本方差
假设的总体方差假设的总体方差
)1(~)1( 2
20
22
n
Sn
)1(~)1( 2
20
22
n
Sn
8 - 8 - 5151
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
方差的卡方差的卡方 方 ((22)) 检验检验(( 例题分析例题分析 ))
【例】【例】某厂商生产出一种新型某厂商生产出一种新型的饮料装瓶机器,按设计要求的饮料装瓶机器,按设计要求,该机器装一瓶一升,该机器装一瓶一升 ((1000cm1000cm33
)) 的饮料误差上下不超过的饮料误差上下不超过 1cm1cm33
。如果达到设计要求,表明机。如果达到设计要求,表明机器的稳定性非常好。现从该机器的稳定性非常好。现从该机器装完的产品中随机抽取器装完的产品中随机抽取 2525瓶,分别进行测定瓶,分别进行测定 (( 用样本减用样本减1000cm1000cm33)) ,得到如下结果。,得到如下结果。检检验该机器的性能是否达到设计验该机器的性能是否达到设计要求要求 ((=0.05=0.05))
0.3 -0.4 -0.7 1.4 -0.6
-0.3 -1.5 0.6 -0.9 1.3
-1.3 0.7 1 -0.5 0
-0.6 0.7 -1.5 -0.2 -1.9
-0.5 1 -0.2 -0.6 1.1
绿色绿色健康饮品健康饮品
绿色绿色健康饮品健康饮品
双侧检验双侧检验
8 - 8 - 5252
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
方差的卡方差的卡方 方 ((22)) 检验检验(( 例题分析例题分析 ))
HH00:: 22 = 1 = 1
HH11:: 22 1 1
= 0.= 0.0505
df df == 25 - 1 = 2425 - 1 = 24
临界值临界值 (s):(s):
统计量统计量 ::
在 在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
不能认为该机器的性能未达到不能认为该机器的性能未达到设计要求设计要求 22220000 39.3639.3639.3639.3612.4012.4012.4012.40
/2 =.05/2 =.05 /2 =.05/2 =.05
决策决策 ::
结论结论 ::
8.201
866.0)125(
)1(20
22
sn
8.201
866.0)125(
)1(20
22
sn
8 - 8 - 5353
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
8.3 8.3 两个总体参数的检验两个总体参数的检验
8.3.1 8.3.1 检验统计量的确定检验统计量的确定8.3.2 8.3.2 两个总体均值之差的检验两个总体均值之差的检验8.3.3 8.3.3 两个总体比例之差的检验两个总体比例之差的检验8.3.4 8.3.4 两个总体方差比的检验两个总体方差比的检验8.3.5 8.3.5 检验中的匹配样本检验中的匹配样本
8 - 8 - 5454
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个正态总体参数的检验两个正态总体参数的检验
两个总体的检验两个总体的检验
Z 检验( 大样本
)
Z 检验( 大样本
)
t 检验( 小样本
)
t 检验( 小样本
)
t 检验( 小样本
)
t 检验( 小样本
)
Z 检验Z 检验 F 检验F 检验
独立样本独立样本独立样本独立样本 配对样本配对样本配对样本配对样本
均值均值 比例比例 方差方差
8 - 8 - 5555
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
独立样本总体均值之差的检验独立样本总体均值之差的检验
8 - 8 - 5656
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的两个总体均值之差的检验检验 ((11
22 、、 2222 已知已知 ))
1.1. 假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本 两个总体都是正态分布两个总体都是正态分布 若不是正态分布若不是正态分布 , , 可以用正态分布来近似可以用正态分布来近似 ((nn1133
00 和 和 nn2230)30)
2.2. 检验统计量为检验统计量为
)1,0(~)()(
2
22
1
21
2121 N
nn
XXZ
)1,0(~
)()(
2
22
1
21
2121 N
nn
XXZ
8 - 8 - 5757
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 假设的形式假设的形式 ))
假设研究的问题
没有差异有差异
均值 1 均值 2
均值 1 < 均值 2
均值 1 均值 2
均值 1 > 均值 2
H0 11 – – 2 2 = 0= 0 11 – – 2 2 0 0 11 – – 2 2 0 0
H1 11 – – 2200 11 – – 2 2 < 0< 0 11 – – 2 2 > 0> 0
8 - 8 - 5858
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 例题分析例题分析 ))
双侧检验!双侧检验!
【例】【例】有两种方法可用于制造某种以有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为产品其抗拉强度的标准差为 88 公斤,公斤,第二种方法的标准差为第二种方法的标准差为 1010 公斤。从公斤。从两种方法生产的产品中各抽取一个随两种方法生产的产品中各抽取一个随机样本,样本量分别为机样本,样本量分别为 nn11=32=32 ,, nn22=4=4
00 ,测得,测得 xx11= = 5050 公斤,公斤, xx22= = 4444 公斤公斤。问这两种方法生产的产品平均抗拉。问这两种方法生产的产品平均抗拉强度是否有显著差别? 强度是否有显著差别? (( = 0.05 = 0.05))
8 - 8 - 5959
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 例题分析例题分析 ))
HH00:: - - = 0 = 0
HH11: : - - 0 0
== 0.050.05
nn11 == 32 32 ,, nn22 = = 4040
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异
83.2
40100
3264
04450)()(
2
22
1
21
2121
nn
xxz
83.2
40100
3264
04450)()(
2
22
1
21
2121
nn
xxz
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
8 - 8 - 6060
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的两个总体均值之差的检验检验 ((11
22 、、 2222 未知且不相等未知且不相等 ,, 小样小样
本本 ))1.1. 检验具有不等方差的两个总体的均值检验具有不等方差的两个总体的均值2.2. 假定假定条件条件
两个样本是独立的随机样本两个样本是独立的随机样本 两个总体都是正态分布两个总体都是正态分布 两个总体方差未知且不相等两个总体方差未知且不相等
3.3. 检验检验统计量统计量
21
2121
11
)()(
nnS
XXt
p
21
2121
11
)()(
nnS
XXt
p
其中:其中:其中:其中:2
)1()1(
21
222
2112
nn
SnSnS p 2
)1()1(
21
222
2112
nn
SnSnS p
8 - 8 - 6161
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的两个总体均值之差的检验检验 ((11
22 、、 2222 未知但相等未知但相等 ,, 小样小样
本本 ))1.1. 检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.2. 假定假定条件条件
两个样本是独立的随机样本两个样本是独立的随机样本 两个总体都是正态分布两个总体都是正态分布 两个总体方差未知但相等两个总体方差未知但相等
3.3. 检验检验统计量统计量
2
22
1
21
2121 )()(
n
S
n
S
XXt
2
22
1
21
2121 )()(
n
S
n
S
XXt
8 - 8 - 6262
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 例题分析例题分析 ))
单侧检验单侧检验 【例】【例】 “多吃谷物,将有助于 “多吃谷物,将有助于减肥。”为了验证这个假设,随减肥。”为了验证这个假设,随机抽取了机抽取了 3535 人,询问他们早餐人,询问他们早餐和午餐的通常食谱,根据他们的和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经食谱,将其分为二类,一类为经常的谷类食用者常的谷类食用者 (( 总体总体 11)) ,一类,一类为非经常谷类食用者为非经常谷类食用者 (( 总体总体 22)) 。。然后测度每人午餐的大卡摄取量然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如。经过一段时间的实验,得到如下结果:检验该假设 下结果:检验该假设 (( = 0.05 = 0.05))
8 - 8 - 6363
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 例题分析—用统计量进行检验例题分析—用统计量进行检验
))
HH00: : - - 0 0
HH11:: - - < 0 < 0
= = 0.050.05
nn11 == 15 15 ,, nn22 == 2020
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
没有证据表明没有证据表明多吃谷物将有助多吃谷物将有助于减肥于减肥
4869.2
20
461.3675
15
429.2431
25.629583
t 4869.2
20
461.3675
15
429.2431
25.629583
t
-1.694-1.694 tt00
拒绝域拒绝域
.05.05
8 - 8 - 6464
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验 (( 例题分析—用例题分析—用 ExcelExcel 进行检验进行检验
))第第 11 步:步:选择“工具”下拉菜单选择“工具”下拉菜单,并,并选择“数据分析”选择“数据分析”选项选项第第 22 步:步:选择“选择“ tt 检验,双样本异方差假设检验,双样本异方差假设””第第 33 步:步:当出现对话框后当出现对话框后 在“变量在“变量 11 的区域”方框内键入的区域”方框内键入数据区域数据区域 在“变量在“变量 22 的区域”方框内键入的区域”方框内键入数据区域数据区域 在“假设平均差”的方框内键入在“假设平均差”的方框内键入 00 在“在“ αα(A)(A)””框内键入框内键入 0.050.05 在“输出选项”中选择输出区域在“输出选项”中选择输出区域 选择选择““确定确定””
8 - 8 - 6565
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个匹配两个匹配 (( 或配对或配对 )) 样本的均值检验样本的均值检验
8 - 8 - 6666
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体均值之差的检验两个总体均值之差的检验(( 匹配匹配样本的 样本的 tt 检验检验 ))
1.1. 检验两个总体的均值检验两个总体的均值 配对或匹配配对或匹配 重复测量 重复测量 (( 前前 // 后后 ))
3.3. 假定条件假定条件 两个总体都服从正态分布两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近如果不服从正态分布,可用正态分布来近
似 似 ((nn11 30 , 30 , nn2 2 30 ) 30 )
8 - 8 - 6767
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
匹配样本的 匹配样本的 tt 检验检验 (( 假设的形式假设的形式 ))
假设研究的问题
没有差异有差异
总体 1 总体 2
总体 1 < 总体 2
总体 1 总体 2
总体 1 > 总体 2
H0 D D == 0 0 D D 0 0 D D 0 0
H1 D D 00 DD< 0< 0 D D > 0> 0
注:注: DDii = = XX11ii - - XX22ii ,对第 ,对第 i i 对观察值对观察值
8 - 8 - 6868
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
匹配样本的 匹配样本的 tt 检验检验 (( 数据数据形式形式 ))
观察序号 样本 1 样本 2 差值1 x 11 x 21 D1 = x 11 - x 21
2 x 12 x 22 D1 = x 12 - x 22
i x 1i x 2i D1 = x 1i - x 2i
n x 1n x 2n D1 = x 1n- x 2n
8 - 8 - 6969
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
匹配样本的 匹配样本的 tt 检验检验(( 检验统计量检验统计量 ))
样本差值均值样本差值均值 样本差值标准差样本差值标准差
自由度自由度 df df == nnD D - 1- 1
统计量统计量
DD
D
nS
DXt 0
DD
D
nS
DXt 0
D
n
ii
D n
DX
1
D
n
ii
D n
DX
1
1
)(1
2
D
n
iDi
D n
XDS
1
)(1
2
D
n
iDi
D n
XDS
DD00 :假设的差值:假设的差值
8 - 8 - 7070
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
【例】【例】一个以减肥为主要目标的健美俱乐部声称,一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重参加其训练班至少可以使减肥者平均体重减重 8.58.5kkgg 以上。为了验证该宣称是否可信,调查人员随机以上。为了验证该宣称是否可信,调查人员随机抽取了抽取了 1010 名参加者,得到他们的体重记录如下表名参加者,得到他们的体重记录如下表::
匹配样本的 匹配样本的 tt 检验检验 (( 例题分析例题分析 ))
在 在 = 0.05= 0.05 的显著性水平下,调查结果是否支持的显著性水平下,调查结果是否支持该俱乐部的声称?该俱乐部的声称?
训练前 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5
训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102
单侧检验单侧检验
8 - 8 - 7171
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
样本差值计算表样本差值计算表训练前 训练后 差值 Di
94.5
101
110
103.5
97
88.5
96.5
101
104
116.5
85
89.5
101.5
96
86
80.5
87
93.5
93
102
9.5
11.5
8.5
7.5
11
8
9.5
7.5
11
14.5
合计 — 98.5
配对样本的 配对样本的 tt 检验检验(( 例题分析例题分析 ))
8 - 8 - 7272
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
配对样本的 配对样本的 tt 检验检验 (( 例题分析例题分析 ))
差值均值差值均值
差值标准差差值标准差
85.910
5.981
D
n
ii
D n
Dx 85.9
10
5.981
D
n
ii
D n
Dx
199.2110
525.43
1
)(1
2
D
n
iDi
D n
xDs 199.2
110
525.43
1
)(1
2
D
n
iDi
D n
xDs
8 - 8 - 7373
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
HH00:: 11 – – 22 8.5 8.5
HH11: : 11 – – 22 < 8.5< 8.5
== 0.05 0.05
df df == 10 - 1 = 910 - 1 = 9
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
不能认为该俱乐部的宣称不可信不能认为该俱乐部的宣称不可信
配对样本的 配对样本的 tt 检验检验 (( 例题分析例题分析 ))
9413.110199.2
5.885.90
DD
D
ns
Dxt 9413.1
10199.2
5.885.90
DD
D
ns
Dxt
-1.833-1.833 tt00
拒绝域拒绝域
.05.05
8 - 8 - 7474
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
配对样本的 配对样本的 tt 检验检验 (( 例题分析—用例题分析—用 ExcelExcel 进行检验进行检验
))第第 11 步:步:选择“工具”选择“工具”
第第 22 步:步:选择“数据分析”选项选择“数据分析”选项第第 33 步:步:在分析工具中选择在分析工具中选择““ tt 检验:平均值的成对检验:平均值的成对
二样本分析”二样本分析”第第 44 步:步:当出现对话框后当出现对话框后 在“变量在“变量 11 的区域”方框内键入的区域”方框内键入数据区域数据区域 在“变量在“变量 22 的区域”方框内键入的区域”方框内键入 数据区域 数据区域 在“假设平均差”方框内键入在“假设平均差”方框内键入 8.58.5 显著性水平保持默认值显著性水平保持默认值
8 - 8 - 7575
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体比例之差的检验两个总体比例之差的检验
8 - 8 - 7676
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
1.1. 假定条件假定条件 两个总体是独立的两个总体是独立的 两个总体都服从二项分布两个总体都服从二项分布 可以用正态分布来近似可以用正态分布来近似
2.2. 检验统计量检验统计量
两个总体比例之差的两个总体比例之差的 ZZ 检验检验
)1,0(~)1()1(
)()(
2
22
1
11
2121 N
n
PP
n
PP
PPZ
)1,0(~)1()1(
)()(
2
22
1
11
2121 N
n
PP
n
PP
PPZ
8 - 8 - 7777
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体比例之差的检验两个总体比例之差的检验(( 假设的形式假设的形式 ))
假设研究的问题
没有差异有差异
比例 1 ≥ 比例 2
比例 1 < 比例 2
总体 1 ≤ 比例 2
总体 1 > 比例 2
H0 PP11––PP2 2 = 0= 0 PP11––PP2200 PP11––PP2200
H1 PP11––PP2200 PP11––PP22<0<0 PP11––PP2 2 >0>0
8 - 8 - 7878
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体比例之差的两个总体比例之差的 ZZ 检验检验 (( 例题分析例题分析 ))
单侧检验单侧检验 【例】【例】对两个大型企业青年对两个大型企业青年工人参加技术培训的情况进工人参加技术培训的情况进行调查,调查结果如下:甲行调查,调查结果如下:甲厂:调查厂:调查 6060 人,人, 1818 人参加人参加技术培训。乙厂调查技术培训。乙厂调查 4040人,人,1414 人参加技术培训。能否根人参加技术培训。能否根据以上调查结果认为乙厂工据以上调查结果认为乙厂工人参加技术培训的人数比例人参加技术培训的人数比例高于甲厂?高于甲厂? (( = 0.05 = 0.05))
8 - 8 - 7979
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体比例之差的两个总体比例之差的 ZZ 检验检验 (( 例题分析例题分析 ))
HH00:: - - 0 0
HH11:: - - < 0 < 0
== 0.050.05
nn11 == 60 60 ,, nn22 = = 4040
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
没有证据表明乙厂工人参加技没有证据表明乙厂工人参加技术培训的人数比例高于甲厂术培训的人数比例高于甲厂
52.0
40)35.01(35.0
60)30.01(30.0
035.030.0
z 52.0
40)35.01(35.0
60)30.01(30.0
035.030.0
z
-1.645-1.645 ZZ00
拒绝域拒绝域
8 - 8 - 8080
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体方差比的检验两个总体方差比的检验
8 - 8 - 8181
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体方差比的检验两个总体方差比的检验((FF 检验检验 ))
1.1. 假定条件假定条件 两个总体都服从正态分布,且方差相等两个总体都服从正态分布,且方差相等 两个独立的随机样本两个独立的随机样本
2.2. 假定形式假定形式 HH00 :: 11
22 = = 2222 或 或 HH00 :: 11
22 222 2 (( 或 或 ) )
HH11 :: 1122 22
22 H H11 :: 1122 22
22 (( 或 或 >)>)
3.3. 检验统计量检验统计量 FF = = SS11
22 / /SS2222~~ FF((nn11 – 1 , – 1 , nn22 – 1) – 1)
8 - 8 - 8282
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体方差的 两个总体方差的 FF 检验检验(( 临界值临界值 ))
0
不能拒绝 H0
F
拒绝 H0
)1,1(
1)1,1(
1222121
nnFnnF
)1,1(
1)1,1(
1222121
nnFnnF
)1,1( 212 nnF )1,1( 212 nnF
/2/2/2/2
拒绝 H0
8 - 8 - 8383
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
两个总体方差的 两个总体方差的 FF 检验检验 (( 例题分析例题分析 ))
HH00: : = =
HH11: :
= 0.05= 0.05
nn11 = 15= 15 ,, nn22 = 20= 20
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
在 在 = 0.05= 0.05 的水平上不拒绝的水平上不拒绝 HH00
不能认为这两个总体的方差有不能认为这两个总体的方差有显著差异显著差异
6615.0461.3675
429.243122
21
s
sF 6615.0
461.3675
429.243122
21
s
sF
0 FFF0.0975 0.0975 =0.352=0.352
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
FF0.025 0.025 =2.62=2.62
8 - 8 - 8484
统计学统计学STATISTICSSTATISTICS
((第四版第四版 ))
作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院
本章小节本章小节
1.1. 假设检验的概念和类型 假设检验的概念和类型 2.2. 假设检验的过程假设检验的过程3.3. 基于一个样本的假设检验问题基于一个样本的假设检验问题4.4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5.5. 利用利用 pp - - 值进行检验值进行检验
结 束