What's in my mind

What!

Monday, 22 March 2010

공분산분석(ANCOVA)

http://blog.naver.com/eclipse0115?Redirect=Log&logNo=50032390662

분산분석은 독립변수가 다른 집단간에 종속변수값의 차이가 있는지를 조사하는 방법임에 반해 공분산분석은 독립변수가 종속변수에 미치는 영향을 알아보기 위해 직접통제하기 어려운 외생변수(잠재변수)를 제거한 후 실시하는 분석입니다. 잠재변수가 종속변수와 상관관계가 높을수록 공분산분석을 실시해야 순수한 처치효과를 조사할 수 있습니다. 단회귀 모델과 중회귀모델도 이런 의미에서는 공분산구조 모델의 일종이라고 할 수 있습니다.
공분산구조 모델의 경우 다변량분석의 여러 가지 기법을 통합한 모델이라고 생각할 수 있으므로 공분산구조 모델을 이용하여 다변량 데이터에 관한 여러 가지 분석이 가능합니다. 공분산구조 모델에서는 측정방정식과 구조방정식이라고 하는 두 종류의 방정식을 사용하여 인과 모델을 표현할 수 있습니다. 다음 표에서는 공분산분석의 하위 모델에 관한 것입니다. 이를 통해 공분산분석이 광범위하다는 것을 알 수 있을 것입니다.
 

측정방정식 이용
구조방정식 이용
측정방정식과 구조방정식 이용
요인분석
분산성분의 추정 모델
주성분분석
다방법 다특성 행렬의 분석
고전적 테스트 모델
일반화 가능성 계수의 추정 모델
와이너 심플렉스 모델
경로분석
회귀분석
동시방정식 모델
다변량회귀분석
분산분석
다변량 분산분석
판별분석
수량화이론 ⅠⅡ
 
다중지표 다중원인 모델
PLS 모델
고차 요인분석
심플렉스 구조 모델
중판별분석
정준상관분석
수량화이론 Ⅲ
패널 데이터 분석

------------------------------------------------------------------------------------

[실 제연구가설 예시]

한 학교에서 학생들의 친사회적인 성향은 성별에 따라 다를 것이라 생각하고 성별을 독립변수로 친사회적인 성향을 종속변수로 설정하여 조사하고자 한다. 학생들의 대인관계능력을 공변량으로 설정하여 순수하게 성별에 따른 친사회적인 성향을 알아보기 위해 대인관계능력에 대한 변수는 통제하기로 하였다.

1) 가설설정
 
<연구문제> 대인관계가 일정한(통제된) 경우 성별에 따른 친사회적인 태도가 다르게 나타난다.
(영가설) : 대인관계가 일정한 경우 성별에 따른 친사회적인 태도는 다르지 않다.
(대립가설) : 대인관계가 일정한 경우 성별에 따른 친사회적인 태도는 다르다.
 
2) 유의수준설정
3) 실행방법

 
공분산분석을 하기 전에 성별에 따라 친사회적인 태도가 나타나는지 알아보기 위해 우선, 일원배치 분산분석을 실시합니다. [예제 10-1]를 불러 다음과 같은 절차를 따라합니다.
 

분석(A)→평균비교(M)→일원배치분산분석(O)

그림 8.1] 대화상자의 옵션(O)에서 기술통계와 분산의 동질성을 설정해 준 후 [확인]을 누르면 다음과 같은 결과가 나타납니다.
 
-->기술통계
친사회적
 


N
평균
표준편차
표준오차
평균에 대한 95% 신뢰구간
최소값
최대값
하한값
상한값
남자
24
12.9583
1.7810
.3636
12.2063
13.7104
8.00
15.00
여자
24
11.4167
1.6918
.3453
10.7023
12.1311
7.00
14.00
합계
48
12.1875
1.8868
.2723
11.6396
12.7354
7.00
15.00

기술통계 표에서는 각 성별에 따른 친사회적행동의 평균과 표준편차, 표준오차, 신뢰구간, 최소값, 최대값이 제시되어 있습니다.

 
-->분산의 동질성에 대한 검정
친사회적
 

Levene 통계량
자유도1
자유도2
유의확률
.000
1
46
.983

 
분산의 동질성에 대한 검정 표에서는 성별에 대한 집단들의 분산의 동질성 가정에 대한 검증 결과가 제시됩니다. 유의확률이 .983으로 영가설을 기각하지 못하므로 분산의 동질성에 대한 가정의 문제는 없다고 결론지을 수 있습니다.
-->분산분석
친사회적
 


제곱합
자유도
평균제곱
F
유의확률
집단-간
28.521
1
28.521
9.453
.004
집단-내
138.792
46
3.017


합계
167.313
47



 
분산분석 표에서는 성별에 따른 친사회적 행동에는 차이가 있는지를 제시해 줍니다. 유의확률이 .004이므로 영가설(성별에 따라 친사회적인 행동에는 차이가 없다)을 기각하므로 성별에 따라 친사회적인 성향에 차이가 있다고 결론지을 수 있습니다. 이에 대한 결과를 토대로 공분산분석을 실시해 봅시다.
 
[예제 10-1]을 다시 부른 후 공분산분석을 시작하기 위해 다음과 같은 절차를 따라합니다.
 

분석(A)→일반선형모형(G)→일변량(U)

이 절차를 따르면 [그림 8.2]와 같은 대화상자가 나타납니다.
 
①, ② 변수목록 칸에 있는 변수 중 종속변수를 종속변수(D)칸으로 독립변수를 모수요인(F)칸으로 통제변수를 공변량(C)칸으로 옮깁니다.
 
③ 모형(M)
모형에서는 완전요인모형(A)과 제곱합(Q)에서는 제 Ⅲ 유형을 설정한 후 [계속]을 누릅니다. 모형에 대한 자세한 내용은 7장의 분산분석의 내용을 참고하시기 바랍니다.
 
④ 옵션(O)
옵션에서는 기술통계량과 동질성검정을 설정한 후 [계속]을 누릅니다.
 
이 과정을 마친 후 [확인]을 누르면 다음과 같은 결과 창이 나타납니다.
 
-->개체-간 요인
 


변수값 설명
N
성별
1.00
남자
24
2.00
여자
24

 
개체-간 요인 표에서는 집단에 따른 케이스(사례수)가 나타나 있습니다.
 
-->기술통계량
종속변수: 친사회적
 

성별
평균
표준편차
N
남자
12.9583
1.7810
24
여자
11.4167
1.6918
24
합계
12.1875
1.8868
48

 
기술통계량 표에서는 성별에 따른 평균과 표준판차, 사례수가 나타나 있습니다.
-->오차 분산의 동일성에 대한 Levene의 검정(a)
종속변수: 친사회적
 

F
자유도1
자유도2
유의확률
1.723
1
46
.196
여러 집단에서 종속변수의 오차 분산이 동일한 영가설을 검정합니다.
a 계획: Intercept+대인관계+성별

 
오차분산의 동일성에 대한 Leveve의 검정 표에서는 성별 집단들의 분산의 동질성 가정에 대한 검증결과가 나타나 있습니다. 유의확률이 0.196으로 영가설을 기각하지 못하므로 집단의 등분산 가정에는 문제가 없다고 결론지을 수 있습니다.
 
-->개체-간 효과 검정
종속변수: 친사회적
 

소스
제 III 유형 제곱합
자유도
평균제곱
F
유의확률
수정 모형
81.736(a)
2
40.868
21.490
.000
Intercept
47.336
1
47.336
24.891
.000
대인관계
53.215
1
53.215
27.983
.000
성별
7.415
1
7.415
3.899
.054
오차
85.577
45
1.902


합계
7297.000
48



수정 합계
167.312
47



a R 제곱 = .489 (수정된 R 제곱 = .466)

개체-간 효과검정 표는 대인관계가 공변량으로 반영된 상태에서의 공분산분석결과입니다. 앞에서의 일원분산분석의 결과와 비교해 보면, 일원분산분석의 경우 성별에 따라 친사회적인 성향이 다르다고 나타난 반면, 공분산분석 결과에서는 (대인관계가 통제된 경우)성별에 따라 친사회적인 성향에 차이가 있다고 결론지을 수 없습니다. 이와 같은 결과는 친사회적인 성향과 상관관계가 높은 대인관계라는 변수가 모형에 포함되었기 때문입니다. 따라서 일원분산분석에서의 결과는 순수하게 성별에 따른 친사회적인 성향의 차이를 본 것이 아니라 응답자의 대인관계에 따른 친사회적인 성향의 결과라고 해석할 수 있습니다.
{ANCOVA}
공 분산분석은 연구외 변인을 통제하거나 검증력 제고를 위해 활용되는 기법이다. 공분산분석은 분산분석의 형식을 취하되, 하나 혹은 그 이상의 변인 상에서 집단을 동등화 할 때 실험적 방법이 아닌 통계적 방법을 적용하게 된다. 원래 공분산분석은 통제대상 변인 상에서 대응집단을 구성하는 것과 같은 방법이다. 즉 공분산분석은 특정 변인의 초기 차이에 비추어 사후검사를 조정한 다음, 이 조정된 범수를 비교한다. 통제대상 변인에 따른 집단간 동등화를 기한 다음, 비교가 이루어진다는 것이다.

종속변인과 상관이 있는 어떤 변인이라도 공분산을 사용하여 통제할 수 있다. 공분산분석에서 통제되는 공변인으로 사전검사 점수, 지능지수 점수, 적성 등이 있다. 이 기법이 공분산을 활용하기 때문에 여타의 연구외 변인으로 돌릴 수 있는 사후검사 점수의 변산을 줄일 수 있고, 이상적으로는 모든 사후검사의 분산을 처치조건에서 기인한 것으로 돌리 수 있게 된다.

공분산분석은 인과비교연구나 실험연구에서 공히 사용될 수 있는 통제기법이다. 여기에서 실험연구에서 사용하는 무선화가 모든 변인 상에서 집단 동등화를 보증하지 못한다는 점을 상기할 필요가 있다. 물론 공분산분석의 활용 시에도 참여자가 처치집단에 무선적으로 할당되어야 한다는 점이 가정된다. 따라서 진실험설계에 공분산분석을 활용하는 것이 최상의 방책이다.

기존집단의 비교시 피험자가 처치집단에 무선적으로 할당되었다면, 공분산분석은 사용가능한 기법이다. 그러나 결과해석 시에는 주의가 요망된다. 만일 인과 비교연구의 경우처럼 기존집단을 대상으로 무조작 독립변인이 있을 때, 이 기법을 적용하였다면, 결과가 오도될 가능성이 있기 때문이다. 공분산분석과 관련하여 또 다른 가정이 있지만, 일단 참여자가 처치집단에 무선할당되었다면, 위의 가정위반은 심각하지 않은 것으로 받아들일 수 있다.

공분산분석의 두 번째 이점은 집단내(오차)분산을 줄임으로써 통계적 검증력을 높인다는 것이다. 여기에서 검증력(POWER)이란 잘못된 영가설을 기각할 수 있는, 즉 옳은 의사결정을 통해 영가설 기각하는 통계적 역량을 지칭한다. 물론 표본 크기를 늘리면, 검증력도 올라가겠지만, 예산상의 이유나 실제적 이유 때문에 한정된 규모의 표본을 활용할 때가 많다. 공분산분석은 여러 집단을 통해 "동등화"함으로써 무선표집오차를 줄일 수 있기 때문에 유의도 검증력이 커진다. 공분산분석의 검증력 제고는 집단 구성시 무선화의 정도와 직결되어 있다. 그러나 집단이 무선적으로 선정할당되지 않을 때에도, 공분산분석 결과는 최소한 타당한 것으로 받아들여질 수 있다

0 comments:

Post a Comment