상세 컨텐츠

본문 제목

분산분석(이원 분산분석)

SPSS

by Damon, Kim 2019. 10. 30. 19:29

본문

 

 

 

두 개의 독립변수에 따른 종속변수의 평균 차이, 이원 분산분석

 

이원 분산분석은 두 개의 독립변수에 따라 집단 간 종속변수의 평균 차이를 비교 검정 하는 방법입니다.

이원 분산분석 결과는 처치효과로 주효과와 상호작용효과를 보여주고, 두 개의 독립변수 간 관계에 따라 두 가지로 구분합니다.

*주효과는 독립변수들이 각각 독립적으로 종속변수에 미치는 영향을 검정하는 것인데, 즉 한 처치변수의 변화가 결과변수에 미치는 영향을 말합니다.

*상호작용효과는 독립변수들이 서로 연관되어 종속변수에 미치는 영향을 검정하는 것인데, 즉 다른 처치변수의 변화에 따라 한 처치변수가 결과변수에 미치는 영향에 관한 것입니다.

예를 들어 이원분산분석을 실시해 볼게요.

독립변수는 2개의 범주형 자료, 종속변수는 연속형 자료가 되어야 합니다.

A회사가 신제품 광고로 세 가지 광고 대안을 기획하고, 피실험자들에게 노출시킨 다음 광고태도를 측정하여 소비자들이 좋아하는 광고를 선택하고자 한다고 가정할게요.

마케팅 기획 담당자는 광고 대안 기획들에 대한 태도가 성별에 따라 다를 것이라 생각하고 어느 집단이 더 좋아할까를 알고 싶어합니다.

실험은 남녀 각 9명의 피실험자들을 6개의 셀에 할당하고 각 피실험자에게 세 가지 광고 중 하나를 보여줍니다.

점수는 0~5점 까지 0.1간격으로 체크한 후 태도 결과 점수는 다음과 같이 나왔다고 가정합니다.

 

성별

광고

1

2

3

4.1

3.1

3.5

3.9

2.8

3.2

4.3

3.3

3.6

2.7

1.9

2.7

3.1

2.2

2.3

2.6

2.3

2.5

 

따라서 가설은 다음과 같습니다.

 

1. 광고대안에 따라 광고태도가 다를까?
2. 성별에 따라 광고태도가 다를까?
3.성별과 광고대안 간에 상호작용효과가 있을까?

 

SPSS에서 분석-일반선형모형-일변량 클릭

변수목록에서 태도점수 클릭 - 종속변수로 이동 - 광고와 성별 클릭 - 모수요인으로 이동

- 도표 - 광고 선택(요인분석창) - 수평축변수로 이동 - 성별 선택(요인분석창) - 선구분변수로 이동 - 추가

- 사후분석 클릭 - 광고 선택(요인분석창) - 사후검정변수로 이동 - 사후분석방법 (Bonferroni(B), Tukey방법(T), Scheffe(C)체크)

- 옵션 클릭 - 기술통계량과 주효과크기추정값 체크 - 계속 클릭 - 확인 클릭

 

개체-간 효과 검정

종속 변수:태도점수

소스

제 III 유형 제곱합

자유도

평균 제곱

F

유의확률

부분 에타 제곱

수정 모형

7.329a

5

1.466

29.318

.000

.924

절편

162.601

1

162.601

3252.011

.000

.996

광고

2.181

2

1.091

21.811

.000

.784

성별

5.014

1

5.014

100.278

.000

.893

광고 * 성별

.134

2

.067

1.344

.297

.183

오차

.600

12

.050

 

 

 

합계

170.530

18

 

 

 

 

수정 합계

7.929

17

 

 

 

 

a. R 제곱 = .924 (수정된 R 제곱 = .893)

 

 

<개체 간 효과 검정>결과표를 보면 태도 점수에 대한 광고 대안과 성별의 주효과, 두 변수의 상호작용효과가 나타납니다.

먼저, 상호작용효과를 보면 F=1.344, 유의확률(p-value)=.297로 나타나

"광고대안과 성별은 상호작용효과가 없는 것"으로 확인됩니다.

 

<도표>는 상호작용효과를 보여주는데 두 개의 선이 나란히 나타나 상호작용 효과가 없다는 것을 보여주고 있습니다.

상호작용효과가 유의하지 않기 때문에 성별에 따라 광고 대안들에 대한 태도의 패턴이 다르다고 할 수 없죠.

여기서 잠깐~~~~!!

이원배치 분산분석에서 그래프가 꼭 X자로 교차해야 할까요?

교차하지 않아도 두 직선의 기울기 차이가 매우 크다면 상호작용 효과는 유의하게 나타납니다.

그럼 그래프가 X자로 교체되었다고 꼭 상호작용 효과가 있을까요?

교차되더라도 두 직선의 기울기가 매우 작다면 두 변수의 상호작용 효과는 유의하지 않게 나타납니다.

즉, 그래프 보다 상호작용 변수의 p값이 유의수준(.05) 보다 작다면 상호작용효과는 유의한 것입니다.

 

기술통계량

종속 변수:태도점수

광고

성별

평균

표준편차

N

1

4.100

.2000

3

2.800

.2646

3

합계

3.450

.7423

6

2

3.067

.2517

3

2.133

.2082

3

합계

2.600

.5514

6

3

3.433

.2082

3

2.500

.2000

3

합계

2.967

.5428

6

합계

3.533

.4924

9

2.478

.3492

9

합계

3.006

.6830

18

 

다음으로 광고 대안의 주효과를 보면, F=21.811, 유의확률(p-value)=.000으로 나타나

"광고대안에 따라 태도점수에는 차이가 있는 것"으로 확인됩니다.

<기술통계량>을 확인해보면 결국, 태도점수는 광고1(3.45), 광고3(2.97), 광고2(2.60)의 순이 됩니다.

다음으로 성별의 주효과를 보면, F=100.278, 유의확률(p-value)=.000으로 나타나

"성별에 따라 태도 점수에는 차이가 있는 것"으로 확인됩니다.

<기술통계량>을 확인해보면 결국, 남자들의 태도점수(3.533)가 여자들의 태도점수(2.48)보다 높습니다.

<개체 간 효과검정>의 결과표에 부분 에타 제곱값은 효과크기를 나타내는 값이에요.

분산분석에서 효과크기는 집단 간 평균 차이를 나타내는 표준치에요.

분산분석에서 효과크기를 판단하는 값인 부분에타제곱의 값이 .01이면 효과크기가 작고, .06이면 중간, .14이면 크다고 판단합니다.

위 표에 상호작용효과의 부분에타제곱값이 .183으로 비교적 크다고 할 수 있습니다.

그런데 효과크기가 큼에도 불구하고 유의하지 않은 결과가 나온것은 표본의 크기가 각 셀당 3개씩 너무 작기 때문이에요.

따라서 표본의 크기가 커질수록 분석결과가 통계적으로 유의하게 나타나고 통계적 검증력 또한 커질 것으로 짐작할 수 있죠.

광고와 성별의 주효과의 부분에타제곱은 각 .784, .893으로 매우 크비다.

<개체 간 효과검정>의 최하단에 있는 R제곱은 두 개의 처치변수와 그 상호작용이 종속변수의 분산을 설명하는 정도를 나타냅니다.

이 경우 두개의 주효과에 관련된 제곱합과 상호작용효과에 관련된 제곱합을 더한 값(2.181+5.014+.134)을 수정합계 값(7.329)로 나누면 값이 .924가 되죠.

즉, 수정모형의 부분에타제곱값에 해당하고, 이는 회귀분석의 R2(알스케어)에 비유될 수 있어요.

다중 비교

종속 변수:태도점수

 

 

(I) 광고

(J) 광고

평균차(I-J)

표준오차

유의확률

95% 신뢰구간

하한값

상한값

Tukey HSD

1

2

.850*

.1291

.000

.506

1.194

3

.483*

.1291

.007

.139

.828

2

1

-.850*

.1291

.000

-1.194

-.506

3

-.367*

.1291

.037

-.711

-.022

3

1

-.483*

.1291

.007

-.828

-.139

2

.367*

.1291

.037

.022

.711

Scheffe

1

2

.850*

.1291

.000

.490

1.210

3

.483*

.1291

.010

.123

.843

2

1

-.850*

.1291

.000

-1.210

-.490

3

-.367*

.1291

.046

-.727

-.007

3

1

-.483*

.1291

.010

-.843

-.123

2

.367*

.1291

.046

.007

.727

Bonferroni

1

2

.850*

.1291

.000

.491

1.209

3

.483*

.1291

.008

.125

.842

2

1

-.850*

.1291

.000

-1.209

-.491

3

-.367*

.1291

.045

-.725

-.008

3

1

-.483*

.1291

.008

-.842

-.125

2

.367*

.1291

.045

.008

.725

 

<다중비교>는 세 집단의 태도값들 간의 사후검증결과를 나타냅니다.

광고1-광고2, 광고2-광고3, 광고1-광고3의 비교 결과 세 가지 방법 모두에서 유의한 차이를 보였습니다.

사후검증에서는 Tukey법에 의한 차이가 가장 유의적으로 나타났어요.

광고1-광고3을 보면 Tukey는 .007, Scheffe는 .010, Bonferroni는 .008이 확인되죠?

그리고 Tukey법에 의한 신뢰구간이 가장 좁아요.

이러한 결과는 각 Cell의 크기가 같은 경우 Tukey법을 사용한다면 집단 간 차이를 가장 정밀하게 감지하는 장접이 있습니다.

 

 


 

 

이번에는 다른 예를 들어 보도록 하겠습니다.

성별과 배달앱 브랜드(A,B,C사)가 선호도에 미치는 영향에 대하여 알아보겠습니다.

선호도는 9점 리커트 척도를 사용한 것으로 가정합니다.

가설은 다음과 같습니다.

 

 

1.배달 앱 브랜드에 따라 선호도에 유의한 차이가 있다.
2. 성별에 따라 선호도에 유의한 차이가 있다.
3. 선호도에 대하여 성별과 배달앱 브랜드 간에 유의한 상호작용 효과가 있을 것이다.

 

 

좀 전 분석해 본 방법과 약간 다른 방식으로 해보겠습니다.

분석방법은 위와 동일합니다.

기술통계량

종속 변수:선호도

성별

배달앱

평균

표준편차

N

남자

A사

3.0000

1.00000

5

B사

4.0000

1.00000

5

C사

7.8000

.83666

5

합계

4.9333

2.31352

15

여자

A사

6.2000

.83666

5

B사

4.2000

.83666

5

C사

6.6000

.89443

5

합계

5.6667

1.34519

15

합계

A사

4.6000

1.89737

10

B사

4.1000

.87560

10

C사

7.2000

1.03280

10

합계

5.3000

1.89646

30

개체-간 효과 검정

종속 변수:선호도

소스

제 III 유형 제곱합

자유도

평균 제곱

F

유의확률

부분 에타 제곱

수정 모형

84.700a

5

16.940

20.743

.000

.812

절편

842.700

1

842.700

1031.878

.000

.977

성별

4.033

1

4.033

4.939

.036

.171

배달앱

55.400

2

27.700

33.918

.000

.739

성별 * 배달앱

25.267

2

12.633

15.469

.000

.563

오차

19.600

24

.817

 

 

 

합계

947.000

30

 

 

 

 

수정 합계

104.300

29

 

 

 

 

a. R 제곱 = .812 (수정된 R 제곱 = .773)

다중 비교

종속 변수:선호도

 

 

(I) 배달앱

(J) 배달앱

평균차(I-J)

표준오차

유의확률

95% 신뢰구간

하한값

상한값

Tukey HSD

A사

B사

.5000

.40415

.444

-.5093

1.5093

C사

-2.6000*

.40415

.000

-3.6093

-1.5907

B사

A사

-.5000

.40415

.444

-1.5093

.5093

C사

-3.1000*

.40415

.000

-4.1093

-2.0907

C사

A사

2.6000*

.40415

.000

1.5907

3.6093

B사

3.1000*

.40415

.000

2.0907

4.1093

 

이원 분산분석 결과 상호작용효과와 두 개의 주효과는 모두 .05수준에서 유의적으로 확인되었습니다.

X축을 배달앱 Y축을 선호도로 하여 그림을 그려보면 남자와 여자의 선이 서로 교차하여 상호작용 효과가 있음을 알 수 있어요.

개체간 효과검정에도 유의하게 나오죠.

특히 배달앱 A사의 경우 남자들의 선호도보다 여자들의 선호도가 매우 높으며 이에 따라 상호작용효과가 크게 나타난 것으로 판단됩니다. 주효과와 상호작용효과의 효과크기(부분에타제곱)은 모두 큰 것으로 확인되었습니다.

다중비교를 보면, 선호도는 A와 C사, B사와 C사가 유의한 차이를 보이고, A사와 B사는 유의한 차이를 보이지 않네요.

대소 관계를 표현한다면, C사 < B사, A사 라고 할 수 있습니다.

 

오늘도 일과 학업을 함께 하시는 파트타임 여러분들 퐈이팅 입니다.~~~!!

 

 

#분산분석 #이원분산분석 #ANOVA #독립표본t검정 # #카이제곱 #카이스퀘어 #박사논문 #석사논문 #학술논문 #SPSS #AMOS #구조방정식 #회귀분석 #논문통계 #통계분석 #데이터분석

 

'SPSS' 카테고리의 다른 글

분산분석(반복측정 분산분석)  (1) 2019.11.07
분산분석 (일원 분산분석)  (0) 2019.10.27
대응표본 t 검정  (0) 2019.09.19
독립표본 t검정  (0) 2019.09.10
카이스퀘어 검증(교차분석)  (0) 2019.09.10

관련글 더보기