Top Banner
1 流流流流流流流流 流流流流流流 Biases and Their Contr ol 流流流 流流流流流流流流流流流流流流
94

流行病学中常见的 偏倚及其控制

Feb 22, 2016

Download

Documents

流行病学中常见的 偏倚及其控制. Biases and Their Control 吴库生 汕头大学医学院预防医学教研室. 误差 ( error ). 对事物某一特征的测量值偏离真实值的部分。 随机误差 ( random error ) 系统误差 ( systematic error ). 随机误差 . 指随机抽样所得的均值与总体参数的差异,也称抽样误差。只能减少,不能避免。 可以是测量方法本身的 随机 变异,也可以是被测定的生物现象的 随机 变异。 利用统计学技术可估计随机误差的大小,但随机误差无法消除。. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 流行病学中常见的 偏倚及其控制

1

流行病学中常见的偏倚及其控制

Biases and Their Control吴库生

汕头大学医学院预防医学教研室

Page 2: 流行病学中常见的 偏倚及其控制

2

误差 ( error ) 对事物某一特征的测量值偏离真实值的部

分。 随机误差 ( random error ) 系统误差 ( systematic error )

Page 3: 流行病学中常见的 偏倚及其控制

3

随机误差 指随机抽样所得的均值与总体参数的差异,也称

抽样误差。只能减少,不能避免。 可以是测量方法本身的随机变异,也可以是被测

定的生物现象的随机变异。 利用统计学技术可估计随机误差的大小,但随机

误差无法消除。

Page 4: 流行病学中常见的 偏倚及其控制

4

随机误差的两个特点 样本的观察值都在平均值上下分布,从许多无偏倚样本中得到的观察值均数,假如数量较大,总是趋向于接近总体值;

随机误差的范围可以用可信区间估计,当保持随机方法而加大样本时,样本均值逐渐向总体均值接近。

Page 5: 流行病学中常见的 偏倚及其控制

5

描述性结果的样本变异性

源群体 样本 A 高胆固醇率 180,174,215,305 305,276,195,215,170 = 40% 233,276,146,195 205,188,190,295 样本 B 170,164,248,162 295,146,220,162,228 =20% 220,219,228,250 样本 C 高胆固醇率 = 25% 219,164,190,188,233 =0% (>240mg/ dL)

图 8-1 源群体与样本高胆固醇率的样本变异性示例

图 8 -1

样本 A

样本 C

样本 B

Page 6: 流行病学中常见的 偏倚及其控制

6

在图 8-1 中,群体高胆固醇率为 25% ,样本 A为 40% ,样本 B为 20% ,样本 C为 0% 。

增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。

Page 7: 流行病学中常见的 偏倚及其控制

7

分析性结果的样本变异性 研究 A(研究对象 200人,随机分配到两组) 膳食改良组 降胆固醇药物组 0 5 10 15 五年内发生 心肌梗死风险(%) 研究 B(研究对象 2000人,随机分配到两组) 膳食改良组 降胆固醇药物组 0 5 10 15 五年内发生 心肌梗死风险(%) 图 8-2 膳食与药物预防心机梗死的样本变异性示例

膳食改良组

膳食改良组

降低胆固醇药物组

降低胆固醇药物组

Page 8: 流行病学中常见的 偏倚及其控制

8

如图 8-2 ,研究 A和 B中膳食改良组五年内发生心机梗死的风险为 9%,而降胆固醇药物组为 6% 。

研究 A样本较小( 200 人),两组效应指标(心肌梗死风险)的 95% 可信限较大,发生重叠,无显著性差异。

研究 B样本较大( 2000 人),两组效应指标(心肌梗死风险)的 95%CI 较小,未发生重叠,有显著性差异。

Page 9: 流行病学中常见的 偏倚及其控制

9

样本越大,效应估计值的抽样误差越小( 95% 可信限越小),统计检验能发现的两组间效应差值越小。

样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。

Page 10: 流行病学中常见的 偏倚及其控制

10

系统误差 当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时,所得均值与总体间的真实性也会产生误差,如果误差向量的方向一致或基本一致时,这种误差称为系统误差。

Page 11: 流行病学中常见的 偏倚及其控制

11

系统误差不是由随机抽样所引起的,而是由某些不能准确定量但较为恒定的因素所引起,其结果导致测量值系统地偏离总体的真实值。

Page 12: 流行病学中常见的 偏倚及其控制

12

举例:用动脉血压计测量某人血压(实际值为80mmHg ),各次读数的均值为 100mmHg ,系统误差和随机误差可用以下图示

随机误差

80 100 舒张压( mmHg )

系统误差发生频次血压计法测量舒张压值的分布

Page 13: 流行病学中常见的 偏倚及其控制

13

随机误差和系统误差的区别 假设一项研究可以将样本量增至无穷大,如果研究样本无穷大能使误差减小到零,则此误差为随机误差。系统误差不受样本量增加的影响,因此在研究样本无穷大时仍然存在的误差是系统误差;

适当的重复试验或增加样本含量可以减少随机误差,但不能减少系统误差。

Page 14: 流行病学中常见的 偏倚及其控制

14

偏倚( bias ) 指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值,使得研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。

Page 15: 流行病学中常见的 偏倚及其控制

15

偏倚的方向(一)正偏倚和负偏倚: 凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为 θ ,而测得值为 θ’ 。 θ = 1.0 为零效应; θ>1 为危险效应; θ<1为保护效应。

Page 16: 流行病学中常见的 偏倚及其控制

16

1.θ>1 时: ( 1 ) θ’>θ>1 时,夸大危险效应,为正偏倚。 ( 2 ) θ>θ’>1 时,缩小危险效应,为负偏倚。2.θ<1 时: ( 1 ) θ’<θ<1 时,夸大 保护效应,为正偏倚。 ( 2 ) θ<θ’<1 时,缩小保护效应,为负偏倚。

Page 17: 流行病学中常见的 偏倚及其控制

17

(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚:无效值指产生零效应的值。例如,对于RR 或 OR 等于 1 时即无效值。就 RR 或 OR而言:

当 θ>1 时,若 θ’>θ>1, 则为远离无效值偏倚。 若 θ>θ’>1, 则为趋向无效值偏倚。当 θ<1 时,若 θ’<θ<1, 则为远离无效值偏倚。 若 θ<θ’<1, 则为趋向无效值偏倚。(三)无论 θ>1 或 θ<1 ,若 θ 和 θ’ 在 1 的两侧,则为颠倒偏倚。

Page 18: 流行病学中常见的 偏倚及其控制

18

3. 举例:( 1 ) RR = 1.5 RR’=2.0 时,为远离无效值正偏倚。( 2 ) RR = 0.6 RR’=0.8 时,为趋向无效值负偏倚。( 3 ) RR=1.2 RR’=0.9 时,为颠倒负偏倚。

Page 19: 流行病学中常见的 偏倚及其控制

19

1946 年, Berkson 做最著名的偏倚研究并给予证实,又称为 Berkson 偏倚。

1976 年, Miettinen 详细讨论了偏倚的定义,并给出分类框架 ,分三类

选择偏倚 信息偏倚 混杂偏倚

Page 20: 流行病学中常见的 偏倚及其控制

20

选择偏倚( selection bias ) 指被选入到研究中的研究对象与没有被选入者特征上的

差异所造成的系统误差。主要产生于研究的设计阶段,在各类流行病学研究中均可能发生,以在病例对照研究与现况研究中为常见。

例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。

Page 21: 流行病学中常见的 偏倚及其控制

21

描述性研究的选择偏倚 主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法 尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等

Page 22: 流行病学中常见的 偏倚及其控制

22

分析性研究的选择偏倚 主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。 控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关

Page 23: 流行病学中常见的 偏倚及其控制

23

常见的选择偏倚 1 、入院率偏倚( admission rate bias ) 亦称伯克森偏倚( Berkson’s bias ) ,是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同或就诊机会的不同而导致的偏倚。

Page 24: 流行病学中常见的 偏倚及其控制

24

不同疾病在不同医院的就诊或住院率各异,其原因是多方面的,如不同医院的技术专长,患者所患疾病的严重程度,患者的经济状况,以及就诊方便与否等。因此,若在医院内选择研究对象进行流行病学研究时,应注意到可能会出现这种偏倚。

Page 25: 流行病学中常见的 偏倚及其控制

25

用住院病例进行研究时可能没有包括: 抢救不及时死亡的病例 距离医院远的病例 无钱住院的病例 病情轻的病例

Page 26: 流行病学中常见的 偏倚及其控制

26

过敏及代谢性疾病与疲乏的关系

疲乏 (一般人群)

疲乏 (曾住院 6个月以上者) 过敏及代谢

性疾病 有 无 合计

有 无 合计

有 13 136 149 1 21 22 无 127 2508 2635 27 208 235 合计 140 2644 2784 28 229 257 OR = 1.89 OR = 0.37

Page 27: 流行病学中常见的 偏倚及其控制

27

呼吸道疾病与骨及运动器官疾病的关系 骨及运动器官疾病 (一般人群)

骨及运动器官疾病 (曾住院 6个月以上者) 呼吸道疾病

有 无 合计

有 无 合计 有 17 207 224 5 15 20 无 184 2376 2560 18 219 237 合计 201 2583 2784 23 234 257 OR = 1.06 OR = 4.06

Page 28: 流行病学中常见的 偏倚及其控制

28

2、现患 - 新发病例偏倚( Prevalence-incidence bias )

又称奈曼偏倚( Neyman bias ) ,凡因现患病例与新病例的构成不同,只调查典型病例或现患病例的暴露状况,致使调查结果出现的系统误差都属于本类偏倚。

Page 29: 流行病学中常见的 偏倚及其控制

29

在美国弗明汉地区对心血管系统疾病的研究中发现:男性居民在队列研究中,具有高胆固醇水平者,患冠心病的 OR 值为 2.4,而在病例对照研究中,病例组和对照组却无明显差异( OR =1.16)。

原因:病例对照研究中的现患病例已改变了他们高胆固醇的饮食习惯。

Page 30: 流行病学中常见的 偏倚及其控制

30

3、无应答偏倚( non-respondent bias ) 无应答者指调查对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作的无应答者可能在某些重要特征或暴露上与应答者有所区别。如果无应答者超过一定比例,就会使研究结果产生偏倚,即无应答偏倚。

Page 31: 流行病学中常见的 偏倚及其控制

31

安阳县食管癌普查,普查率仅 20 %左右,不能代表总体。造成无应答的主要原因: 研究对象不了解研究目的;调查内容不当,过于繁琐,涉及隐私;对象不能正理解调查内容(文化低、高龄等);对象病重、外出。

Page 32: 流行病学中常见的 偏倚及其控制

32

研究人员调查美国西北部铁路职工冠心病分布情况。虽然采取各种措施鼓励和要求全体职工参加此项工作,但一般职工只有 73.6%,扳道工只有58% 自愿参加。初步分析结果表明,一般职工冠心病现患率为 43‰,扳道工为 24 ‰ ,两者差异有显著性。

Page 33: 流行病学中常见的 偏倚及其控制

33

失访偏倚:是一种无应答,主要发生在前瞻性队列研究和实验研究中。( 1 )随访过程中因种种原因拒绝继续留在观察组中。( 2 )观察对象在出现预期的结果之前死于其他疾病或事故。 如果暴露组与对照组观察对象均有 500人,随访过程中均失访 100 人,其结果是否可靠???

Page 34: 流行病学中常见的 偏倚及其控制

34

4、志愿者偏倚( volunteer bias ) 志愿者与非志愿者在关心健康、注意饮食卫生及营养食疗、戒烟戒酒、体育锻炼等方面有系统差别。如选择志愿者为对象,而非志愿者常落选,可能会产生偏倚。 例如:观察体育锻炼预防冠心病的效果 实验组为志愿者,非志愿者为对照组。

Page 35: 流行病学中常见的 偏倚及其控制

35

美国疾病控制中心调查参加过内华达州原子武器实验部队中继发白血病的发病情况时,追踪随访了 76%的人,其中 82%是调查员追踪到的,但有 18%是由于宣传的影响而主动与调查员接触的。 18%主动报告的研究对象中有 4例白血病,而 82% 调查员随访的对象也只有 4例。

Page 36: 流行病学中常见的 偏倚及其控制

36

5、检出征候偏倚( detection signal bias ) 亦称为揭露伪装偏倚( unmasking bias ),指某因素与某疾病在病因学上虽无关联,担由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该病相关联的错误结论。

Page 37: 流行病学中常见的 偏倚及其控制

37

有人以病例对照研究发现,子宫内膜癌患者的雌激素比例显著高于对照组,认为子宫内膜癌与服用雌激素密切相关。

Page 38: 流行病学中常见的 偏倚及其控制

38

1978 年, Horwitz 和 Feinstein :口服雌激素与子宫内膜癌的高度关联是虚假的,是一种检出偏倚。( 1 )人群中有一定量无症状的子宫内膜癌早期病人。( 2 )无症状的子宫内膜癌早期病人如服用雌激素易发生子宫出血而就诊,由此被发现而选入病例组。( 3 )对照组为一般住院病人。 结果:雌激素服用率高于对照组。

Page 39: 流行病学中常见的 偏倚及其控制

39

Feinstein从同一医院中随机选取妇科其他良性肿瘤患者为对照进行研究:口服雌激素与子宫内膜癌无关联。

Page 40: 流行病学中常见的 偏倚及其控制

40

6、易感性偏倚( susceptibility bias ) 有些因素可能直接或间接影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此产生的偏倚称为易感性偏倚。

如:当研究某种有毒物质对工人的健康危害时,常发现暴露于有毒物质的工人的死亡率比一般人群还低,这主要是接触该有毒物质的工人,其初始的健康水平要比一般人群要高,其易感性低。

Page 41: 流行病学中常见的 偏倚及其控制

41

健康工人效应 有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。研究者选择了家具制造厂的工人作为暴露组,以全体人群作为非暴露组,结果发现家具制造厂工人的呼吸系统疾病的死亡率低于全人群。

Page 42: 流行病学中常见的 偏倚及其控制

42

7、排除偏倚( exclusive bias ) 在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。

Page 43: 流行病学中常见的 偏倚及其控制

43

在一项关于阿司匹林与心肌梗塞关系的病例对照研究中,病例组与对照组均不应包括患慢性关节炎者,亦不应包括慢性胃溃疡病人,因前者倾向于服用此药,而后者倾向于不服用此药。

Page 44: 流行病学中常见的 偏倚及其控制

44

研究利血平与乳腺癌关系时,若病例组(患乳腺癌妇女)含有高血压患者,而对照组没有,即使利血平与乳腺癌无任何关联,结果也可能会显示两者之间在统计学上的联系,因为高血压患者增加了利血平的暴露率。

Page 45: 流行病学中常见的 偏倚及其控制

45

选择偏倚的控制 研究者应充分了解该项研究工作中各种可能的选择偏倚来

源,并在研究设计过程中尽量避免; 严格掌握研究对象的纳入与排除标准,使研究对象能较好

地代表其所出自的总体; 为了避免存活因素的影响,在进行病例对照研究时,如果

病例组选择新诊断的病人,则对照组不应由慢性病病人组成;如果对照所患的慢性病严重地影响暴露,则更不应作为对照;

Page 46: 流行病学中常见的 偏倚及其控制

46

为了避免由于拒绝参加研究而引入选择偏倚,应尽可能地降低拒绝参加人员的比例。有人主张对拒绝参加者做出各种假设分开分析;

在队列研究中随访全部研究对象,或获得尽可能高的应答率,可能预防或减小偏倚。

Page 47: 流行病学中常见的 偏倚及其控制

47

信息偏倚( information bias ) 又称观察偏倚( observational bias ),指研究中有关研究对象的或来自研究对象的信息是错误的,会产生系统误差。信息偏倚的表现是使研究对象的某种特征被错误分类如暴露者与某因素被错误地认为是非暴露者,某病的患者被认为是非患者。

Page 48: 流行病学中常见的 偏倚及其控制

48

常见的信息偏倚 1 、回忆偏倚( recall bias ) 指在回忆过去的暴露史或既往史时,因研究对象的记忆失真或回忆不完整,使其准确性或完整性与真实情况间存在的系统误差。

Page 49: 流行病学中常见的 偏倚及其控制

49

小儿白血病←→母亲怀孕时接受 x线的回忆 死于白血病的小儿的母亲增加了暴露于 x线的回忆。

病例 医院 对照 社区认真回忆暴露史 暴露经历易遗忘或不重视

Page 50: 流行病学中常见的 偏倚及其控制

50

回忆偏倚产生的原因 由于调查的因素或事件发生的频率低,未给研究对象留下深刻的印象而被遗忘;

调查事件是很久以前发生的事情,研究对象记忆不清或已经遗忘;

研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异,回答问题的多少及准确性也有所不同。

Page 51: 流行病学中常见的 偏倚及其控制

51

2、报告偏倚( reporting bias ) 与回忆偏倚不同,报告偏倚是指研究对象因某种原因故意夸大或缩小某些信息而导致的偏倚,因此也称说谎偏倚。

如隐瞒与隐私有关的暴露史 保护调查对象声誉隐瞒不良暴露史 夸大职业暴露

Page 52: 流行病学中常见的 偏倚及其控制

52

3、诊断怀疑偏倚(diagnostic suspicion bias ) 如果研究者事先了解研究对象对研究因素的暴露情况,怀疑其已经患某病,或在主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于自己的判断。如对暴露者或实验组进行非常细致的检查,而对非暴露者或对照组则不然,从而使研究结果出现偏差。

Page 53: 流行病学中常见的 偏倚及其控制

53

对较长期服用氯霉素的患者,医生反复查血象,甚至进行骨髓象等检查,可较早较多地发现粒细胞减少症、再生障碍性贫血等疾病,而服用其他药物的疾病则不注意血象检查,使以上疾病不能被及时发现,结果是人为夸大了服用氯霉素与粒细胞减少症、再生障碍性贫血等疾病的关联。

Page 54: 流行病学中常见的 偏倚及其控制

54

多见于临床试验、队列研究,特别是在诊断亚临床病例、判断药物的不良反应时最易产生。研究口服降糖灵治疗 2型糖尿病是否导致心血管病死亡率升高 降糖灵组:死亡者均尸体解剖,寻找心血管病的死因。 其他组:(对照组、胰岛素组) 难得解剖

Page 55: 流行病学中常见的 偏倚及其控制

55

4、暴露怀疑偏倚( exposure suspicion bias ) 研究者若事先了解研究对象的患病情况或某种结局,主观上认为某病与某因素有关联时,在病例组和对照组中采用不同的方法或使用不同深度和广度的调查方法探索可疑的致病因素,从而导致错误的研究结论,由此引起的偏倚称为暴露怀疑偏倚。

Page 56: 流行病学中常见的 偏倚及其控制

56

在对儿童甲状腺癌过去放射性物质暴露史的调查中发现,在分别为 36 和 22例的两组患儿中,以常规方法调查发现有暴露史者分别为 28% 和 0,而通过深入的调查和询问发现,两组有暴露史者分别达到 47% 和 50%。

Page 57: 流行病学中常见的 偏倚及其控制

57

5、检出偏倚( detection bias ) 实验过程中由于实验的仪器和试剂质量不好及操作人员的操作误差造成的偏倚称为检出偏倚。

Page 58: 流行病学中常见的 偏倚及其控制

58

6、诱导偏倚( inducement bias ) 在调查过程中,调查者询问技术不当,或者为取得阳性结论,诱导调查对象做某一倾向性的回答,从而使调查到的结果偏离真实情况,由此产生的偏倚称诱导偏倚。

Page 59: 流行病学中常见的 偏倚及其控制

59

信息偏倚的控制 研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法;

尽可能采用“盲法”收集资料; 尽量采用客观指标的信息; 严格调查设计和研究人员的科学态度。

Page 60: 流行病学中常见的 偏倚及其控制

60

收集资料的范围可以适当有意识地扩大些,借以分散调查人员和研究对象对某项因素的注意力,减少某些偏见带来的偏倚。

通过调查知情人或采用相应的调查技术,获取正确信息,避免报告偏倚。

选择一个与暴露史有联系的鲜明的记忆目标帮助其联想记忆或选择新病例作为对象。

Page 61: 流行病学中常见的 偏倚及其控制

61

为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物( biological markers )。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。

Page 62: 流行病学中常见的 偏倚及其控制

62

混杂偏倚( confounding bias ) 混杂偏倚指在流行病学研究中,由于一个或多各潜在的混杂因素的影响,掩盖或夸大了研究因素与疾病之间的联系,从而使两者之间的真正联系被错误地估计。

Page 63: 流行病学中常见的 偏倚及其控制

63

混杂因素 亦称外来因素,指与研究因素和研究疾病均有关,若在比较的人群中分布不均,可歪曲研究因素与疾病之间真正联系的因素。

Page 64: 流行病学中常见的 偏倚及其控制

64

混杂因素的基本特征 必须是所研究疾病的独立危险因素,如果不找出或不避开,所得的研究结果可能不是研究因素造成的;

必须与所研究的暴露因素存在统计学联系; 一定不是研究因素与研究疾病因果链上的一个环节或中间变量。

Page 65: 流行病学中常见的 偏倚及其控制

65

重度饮酒与肺癌关系 目前指吸烟是肺癌病因之一,饮酒的人多吸烟。如果研究重度饮酒与肺癌关联的资料,可以看到重度饮酒者肺癌死亡率比不饮酒者高,那么重度饮酒是肺癌的病因吗?

Page 66: 流行病学中常见的 偏倚及其控制

66

在全体观察对象中饮酒与肺癌的关系(模拟资料)

率比: 60/40 = 1.5

肺癌 饮酒者 是 否

合计 率(‰ )

是 60 940 1000 60 否 40 960 1000 40 合计 100 1900 2000 50

Page 67: 流行病学中常见的 偏倚及其控制

67

在不吸烟者中饮酒与肺癌的关系(模拟资料)

率比: 10/10 = 1.0

肺癌 饮酒者 是 否

合计 率(‰ )

是 4 396 400 10 否 6 594 600 10 合计 10 990 1000 10

Page 68: 流行病学中常见的 偏倚及其控制

68

在吸烟者中饮酒与肺癌的关系(模拟资料)

率比: 93/85 = 1.1

肺癌 饮酒者 是 否

合计 率(‰ )

是 56 544 600 93 否 34 366 400 85 合计 90 910 1000 90

Page 69: 流行病学中常见的 偏倚及其控制

69

在不吸烟者中看不到饮酒与肺癌之间的关联,在大量吸烟者中,也看不到饮酒与肺癌之间的关联。吸烟是肺癌的病因之一,又与正在研究的暴露(饮酒)有关联,所以,在这项研究中吸烟是个混杂因素。

Page 70: 流行病学中常见的 偏倚及其控制

70

在研究吸烟与肺癌的关系时,可能的混杂因素有什么呢?

Page 71: 流行病学中常见的 偏倚及其控制

71

判定原则 比较混杂因素调控前后的暴露因素效应估计值,

如果存在有意义的差异,就产生了混杂偏倚。

调控的统计方法 设计阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入

Page 72: 流行病学中常见的 偏倚及其控制

72

混杂偏倚 假关联继发关联直接因果关联的歪曲

C

E

D D

E

FD

E

F

( 1 )继发关联 ( 2 )直接因果关联的歪曲 ( 3 )直接因果关联的歪曲图 混杂偏倚引起假关联

? ? ?

Page 73: 流行病学中常见的 偏倚及其控制

73

1. 继发关联( secondary association)纯粹由混杂偏倚产生的关联怀疑的病因(暴露) E与疾病 D并不存在因果关系,而由于两者( E,D)有共同的原因 C,从而继发产生 E与 D的关联E与 C也可以由于相关(因果方向不明)而产生继发关联

C

E

D( 1 )继发关联

Page 74: 流行病学中常见的 偏倚及其控制

74

黄色瘤 D

喝咖啡 E

高血清胆固醇 C

吸烟 C

胰腺癌 D

冠心病 E

例:

继发关联

Page 75: 流行病学中常见的 偏倚及其控制

75

2. 直接因果关联的歪曲 怀疑的病因(暴露) E 与疾病 D既存在直接关联,又存在间接关联(图5,(2))或与其他危险(保护)因素 F存在相关(图5,(3))直接因果关联程度或方向将可能受到混杂干扰,歪曲估计值

D

E

FD

E

F? ?( 2 )直接因果关联的歪曲 ( 3 )直接因果关联的歪曲

Page 76: 流行病学中常见的 偏倚及其控制

76

HIV感染D

性乱 F

静脉吸毒 E

例:

直接因果关联的歪曲

Page 77: 流行病学中常见的 偏倚及其控制

77

静脉吸毒 E与性乱 F都是 HIV感染 D的危险因素,吸毒者易发生多性伴行为,即吸毒同 HIV感染既存在直接关联( E→D)又存在间接关联( E→F→D)(图 8-3,(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图 8-3,(3)),多性伴 F将对吸毒 E与 HIV感染 D的直接因果关联起混杂或歪曲作用。

Page 78: 流行病学中常见的 偏倚及其控制

78

混杂的控制 1 、限制 针对某一或某些可能的混杂因素,在设计时对研究对象的入选条件予以限制。控制已知的混杂因素,不能控制未知的混杂因素。

Page 79: 流行病学中常见的 偏倚及其控制

79

利:对研究对象针对潜在的混杂因素实行限制后,可得到同质的研究对象,从而可以防止某些混杂偏倚,有利于对研究因素与疾病之间的关系作出较为准确的估计

弊:研究对象对总体的代表性可能会受到影响,因而研究结论的外推会受到一定的限制

Page 80: 流行病学中常见的 偏倚及其控制

80

2、匹配 在为研究对象选择对照时,使其针对一个或多个潜在的混杂因素与研究对象相同或接近,从而消除混杂因素对研究结果的影响。

Page 81: 流行病学中常见的 偏倚及其控制

81

利:对某一因素进行匹配可以消除掉该因素可能的混杂作用,提高统计效率

弊:失掉了对这一因素进行分析的机会,既不能分析其作为研究疾病危险因素的作用,也不能分析该因素与其他因素间的交互作用,造成信息丢失

Page 82: 流行病学中常见的 偏倚及其控制

82

3、随机化 指以随机化原则使研究对象以等同的几率被分配在各处理组中,从而使潜在的混杂因素在各组间分布均衡。

Page 83: 流行病学中常见的 偏倚及其控制

83

4、统计处理 混杂偏倚在资料分析阶段也可以通过一定的统计处理方法予以控制。如分层分析、使用回归模型等。

Page 84: 流行病学中常见的 偏倚及其控制

84

混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤

对可能的混杂因素进行分层 判定层间 RR或 OR是否相等或相近 得到控制混杂后的调整 RR或 OR 再将调整 RR或 OR与分层前的粗 RR或粗 OR( cRR或 cOR)进行比较

Page 85: 流行病学中常见的 偏倚及其控制

85

( 1)按可能的混杂因素吸烟分层表 9-6 饮酒与肺癌病例对照研究

饮酒 不饮酒 合计 肺癌病例 24 10 34 对照 26 40 66 合计 50 50 100

表 9-7 饮酒与肺癌病例对照研究分层分析 吸烟层 (i = 1) 不吸烟层 (i = 2)

饮酒 不饮酒 小计 饮酒 不饮酒 小计 肺癌病例 21 6 27 3 4 7 对照 9 4 13 17 36 53 合计 30 10 40 20 40 60

表 8-7

表 8-8

ai bi m1i ci di m0i

ni n0 ti

Page 86: 流行病学中常见的 偏倚及其控制

86

(2) 判定层间关联效应水平是否同质

按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验 )的,可以应用 M-H方法计算综合OR

121 4 1.566 9

OR

2

3 36 1.594 17

OR

1 2OR OR

Page 87: 流行病学中常见的 偏倚及其控制

87

(3) 计算综合或调整 OR,并与粗 OR比较

2

22 2

21 4 6 19 / 40 3 36 4 17 / 600.6509

27 13 30 10 / 40 1 40 7 53 20 40 / 60 1 60 MH

21 4 / 40 3 36 / 60 1.576 9 / 40 4 17 / 60

MHOR

24 40 3.6910 26

cOR

MHcOR OR

P >0.25

Page 88: 流行病学中常见的 偏倚及其控制

88

(4) 结论吸烟对饮酒与肺癌的关联( cOR = 3.69 )有混杂作用( cOR ≠ ORMH)控制吸烟的混杂作用后,饮酒与肺癌无关联( 2 = 0.6509, P > 0.25 )注意针对 ORMH的 2检验是在排除了混杂偏倚的基础上再排除随机误差,而针对 cOR的 2检验是建立在没有排除混杂偏倚的基础上的

Page 89: 流行病学中常见的 偏倚及其控制

89

现况研究中常见的偏倚 选择偏倚 无应答偏倚 幸存者偏倚 报告偏倚 回忆偏倚 测量偏倚

Page 90: 流行病学中常见的 偏倚及其控制

90

病例对照研究中常见的偏倚 入院率偏倚 现患病例 - 新发病例偏倚 检出症候偏倚 时间效应偏倚 回忆偏倚 调查偏倚 混杂偏倚

Page 91: 流行病学中常见的 偏倚及其控制

91

队列研究中常见的偏倚 选择偏倚 失访偏倚 信息偏倚 混杂偏倚

Page 92: 流行病学中常见的 偏倚及其控制

92

讨论:原发性肝癌病例对照研究 进行研究设计时应充分考虑到各种可能出现的偏倚,提出几种你认为可能对结果影响较大的偏倚及预防和控制的方法。

Page 93: 流行病学中常见的 偏倚及其控制

93

病例的选择 对照的选择 调查表的设计 混杂因素的控制

Page 94: 流行病学中常见的 偏倚及其控制

94

谢 谢!