3
분산분석
분산분석(analysis of variance)의 의미 세 개 이상의 모평균의 동일성(equality)을 검정하는 기법
관측자료와 실험자료를 분석에 사용한다.
가정 모집단은 정규분포를 따른다.
모집단은 동일한 분산을 갖는다.
각 모집단에서 표본을 무작위로 추출한다.
모든 표본은 서로 독립적으로 추출한다.
4
실험설계의 기본개념
반응변수(response variable) : 종속변수
인자(factor) : 요인, 독립변수 종속변수에 영향을 미치는 변수
외생변수(extraneous variable) 종속변수에 영향을 미치는 변수 가운데 독립변수를 제외한
외부적인 요인
인자수준(factor) : 처리(treatment), 수준(level)
반복(replicatoin) : 인자수준에 따라 여러 번 표본을
추출하는 것
랜덤화(randomization) : 실험순서를 무작위로 결정하는
것
6
분산분석의 기본원리
분산분석의 목적 여러 인자간 표본평균이 동일한가를 테스트함으로써 그 인자가
모평균에 현저한 영향을 미치는가를 밝히려고 한다.
분산분석의 논리 특정 수준에 따라 구분되는 여러 모집단에서 표본들을 추출할
때 각 표본관측치에서 전체 표본들의 총평균을 뺀 차이,
즉 편차들의 제곱합인 총변동은 원래 각 모집단의 평균이
서로 다르기 때문에 발생할 수도 있고 또는 각 모집단내
관측치들의 무작위적 변동으로 인해 발생할 수도 있는데
전자의 그룹간 변동이 후자의 그룹내 변동보다 현저히
크다면 모집단들의 평균이 서로 다르다고 추정할 수 있다.
7
분산분석의 기본원리
가설
귀무가설이 기각되면 모든 모평균이 서로 다르다고 결론
내릴 수는 없다.
귀무가설이 기각되면 적어도 두 개의 모 평균이 다른 값을
갖는다는 것을 의미한다.
그러나 어느 모평균이 다른 모평균들과 다른지는 알 수
없다. 이럴 경우에는 모든 두 모집단의 쌍에 대해 검정을
해야 한다.
8
일원배치법
일원배치법(one-way ANOVA) : 완전무작위
설계법(completely randomized design) 어떤 반응변수에 영향을 미치는 여러 인자 중에서 하나의인자만을 실험대상으로 하는 계획을 말한다.
반복 수가 같은 일원배치법의 데이터 배열
10
일원배치법
총변동의 분해 총편차(total deviation) : 각 관측치 와 데이터의총평균 와의 편차의 합계를 말한다.
총편차 = 인자수준의 변화에 의한 각 수준의 평균과 총평균과의 편차
(설명된 편차)
+
오차발생에 의한 각 수준 내의 관측치와 그 수준의 평균과의 편차
(설명되지 않은 편차)
20
반복 없는 이원배치법
의의 : 두 개 인자의 각 수준의 조합에서 반복실험이 없는
경우로서 무작위 블록 설계법(randomized block
design)이라고도 한다.
데이터의 배열
28
반복 있는 이원배치법
의의 두 인자가 종속변수에 미치는 영향을 분석한다.
두 인자의 다른 수준 사이의 교호작용효과(interaction
effect)를 분석한다.
반응변수와 한 인자 사이의 관계가 다른 인자의 수준에 의해
영향을 받을 때 두 인자 사이에는 교호작용효과가 존재한다.