상세 컨텐츠

본문 제목

분산분석 (일원 분산분석)

SPSS

by Damon, Kim 2019. 10. 27. 14:02

본문

세 개 이상 집단 간 평균 비교, 일원 분산분석

 

t검정은 두개의 평균을 비교하는 분석이었죠?

일원 분산분석은 세 개 이상의 평균을 비교하는 데 사용하는 통계 기법입니다. 이때 검증통계량은 F입니다.

t검정과 마찬가지로, 독립변수는 세 개 이상의 범주형 자료의 명목척도로 측정되고, 종속변수는 연속형 자료의 간격 혹은 비율 척도로 측정됩니다.

분산분석은 단일변량 분산분석과 다변량 분산분석, 공분산 분산분석 등으로 나뉩니다.

단일변량은 독립변수의 개수에 따라 일원(1개), 이원(2개), 다원(3개이상)으로 구분되고 종속변수는 1개여야 해요.

다변량은 독립변수가 1개 이상이고 종속변수는 2개 이상일 때 이용됩니다.

일원 분산분석을 예를 들어 실시해 보겠습니다.

3개 이상의 표본 집단이 필요합니다.

회사에서 마케팅 직원들을 위한 신규 교육 프로그램의 효과에 차이가 있는가를 조사하기 위해 실험을 실시했다고 가정하겠습니다.

31명의 직원들을 대상으로 무작위로 세 집단으로 나누어 교육 프로그램 A, B, C로 교육을 실시

교육을 마친 후 한 달간의 매출 실적 조사

직원들을 무작위로 구분하였기 때문에 각 집단에 속한 직원들의 교육받기 전 판매 능력은 동일한 것으로 가정

 

가설은 다음과 같습니다.

 

 

"3가지 직원 교육 프로그램에 따른 매출에는 차이가 있을 것이다."

 

즉, 교육 프로그램에 따라 매출 실적이 다르다고 할 수 있는가?

독립표본 t검정 가설 형태와 별반 차이가 없습니다. 다만, t검정이 두 개 집단의 범주형 자료를 비교한다면 분산분석은 세 개 이상 집단의 범주형 자료를 비교하는 분석 방법인 것이죠.

SPSS에서 분석 - 평균비교 - 일원배치 분산분석 클릭

새창에서 독립변수(교육방법) 클릭 - 요인으로 이동 - 종속변수(매출실적)클릭 - 종속변수로 이동

옵션 클릭 - 통계량의 기술통계와 분산 동질성 검정 체크 - 계속 클릭

사후분석 클릭 - Scheffe와 Duncan 체크 - 계속 클릭 - 확인

사후분석 다중비교를 위한 방법은 Turkey, Scheffe, Bonferroni, Duncan법 등이 있어요.

Turkey법은 각 Cell의 크기가 같을때만 사용하고 Scheffe법과 Benferroni법은 각 Cell의 크기가 같거나 다르거나 상관없이 사용합니다.

특히 사회화학에서는 Scheffe와 Duncan을 사후분석으로 많이 이용하고 일반적으로 Scheffe를 많이 사용합니다.

기술통계

매출실적

 

N

평균

표준편차

표준오차

평균에 대한 95% 신뢰구간

최소값

최대값

하한값

상한값

program A

8

75.75

7.086

2.505

69.83

81.67

65

87

program B

11

76.82

6.735

2.031

72.29

81.34

69

90

program C

12

71.50

9.279

2.678

65.60

77.40

59

83

합계

31

74.48

8.024

1.441

71.54

77.43

59

90

 

<기술통계>에서 유의하게 봐야 할 것은 각 집단의 평균치 입니다.

기술 통계값은 프로그램 B의 실적이 가장 높고, 프로그램 A, C순으로 나타났습니다.

 

분산의 동질성 검정

매출실적

Levene 통계량

df1

df2

유의확률

2.402

2

28

.109

 

분산분석은 모집단이 같다는 가정하에 실시됩니다.

<분산의 동질성 검정>의 Levene통계량을 이용하여 분산의 동질성에 대해 검정한 결과를 보면 P-value는 .109로서 등분산 가정에 문제가 없습니다.

* 분산의 동질성 검정은 모딥단의 분산이 동일하다는 가정이 충족되어야 하는데 값이 .05보다 크면 유의한 차이를 보이지 않기 때문에 분산이 동질성을 만족합니다. .05보다 작으면 유의한 차이를 보이니까 분산이 동일하지 않다는 것입니다.

이런 제길~~~

P값이 .05보다 작아야 채택하는 거 아닌가 하고 헷갈린다구요?

그냥, 분산의 동질성 검정을 만족하기 위해서는 유의확률이 무조건 .05보다 크게 나와야 한다고 기억해요, 우리~~^^

 

분산분석

매출실적

 

제곱합

df

평균 제곱

F

유의확률

집단-간

179.606

2

89.803

1.435

.255

집단-내

1752.136

28

62.576

 

 

합계

1931.742

30

 

 

 

 

<분산분석>결과를 보면 F=1.435, P-value=.255이네요.

즉, 각 교육프로그램에 따른 매출실적은 차이가 없는 것으로 확인됩니다.

다중 비교

종속 변수:매출실적

 

(I) 교육방법

(J) 교육방법

평균차(I-J)

표준오차

유의확률

95% 신뢰구간

 

하한값

상한값

Scheffe

 

program A

 

program B

-1.068

3.676

.959

-10.57

8.43

program C

4.250

3.611

.509

-5.08

13.58

program B

 

program A

1.068

3.676

.959

-8.43

10.57

program C

5.318

3.302

.289

-3.22

13.85

program C

 

program A

-4.250

3.611

.509

-13.58

5.08

program B

-5.318

3.302

.289

-13.85

3.22

 

 

<다중비교>도 당연히 교육프로그램에 따른 매출실적은 유의한 차이가 없습니다.

 

 

 

이번에는 다른 예를 들어보겠습니다.

TV의 품질 및 디자인이 브랜드에 따라 유의하게 차이가 나는지 알아보겠습니다.

표본은 A사 117명, B사 90명, C사 127명으로 조사 되었습니다.

독립변수는 브랜드이고, 종속변수는 품질과 디자인 입니다.

가설은 다음과 같습니다.

 

"브랜드에 따라 TV의 품질 및 디자인에는 유의한 차이가 있을 것이다."

 

즉, 소비자들이 브랜드에 따라 TV 품질과 디자인에 차이가 있는가를 알아보는 것이죠.

SPSS 분석방법은 위와 동일합니다.

기술통계

 

N

평균

표준편차

표준오차

평균에 대한 95% 신뢰구간

최소값

최대값

하한값

상한값

품질

A

117

153.878

5.8675

.5425

152.803

154.952

133.0

170.0

B

90

157.778

5.2732

.5558

156.673

158.882

145.2

176.2

C

127

159.496

4.6032

.4085

158.688

160.304

148.0

171.5

합계

334

157.065

5.7795

.3162

156.443

157.687

133.0

176.2

디자인

A

116

75.883

5.1753

.4805

74.931

76.835

61.0

88.0

B

90

77.396

6.6788

.7040

75.997

78.794

66.0

102.0

C

127

79.340

6.2818

.5574

78.237

80.443

66.5

104.5

합계

333

77.610

6.1977

.3396

76.942

78.278

61.0

104.5

 

<기술통계>를 보면 품질은 평균이 올라감에 따라 감소하고, 디자인에 대한 표준편차는 B사가 다른 브랜드에 비해 약간 크게 나타났습니다.

분산의 동질성 검정

 

Levene 통계량

df1

df2

유의확률

품질

1.759

2

331

.174

디자인

1.442

2

330

.238

 

<분산의 동질성 검정>을 보면 품질과 디자인 모두 .05보다 크기 때문에 등분산의 가정이 충족되었습니다.

이로써 품질과 디자인의 차이가 있는가 알아보기 위해 일원배치 분산 분석을 사용할 수 있는 것이죠.

분산분석

 

제곱합

df

평균 제곱

거짓

유의확률

품질

집단-간

1984.834

2

992.417

35.947

.000

집단-내

9138.186

331

27.608

 

 

합계

11123.020

333

 

 

 

디자인

집단-간

730.376

2

365.188

10.024

.000

집단-내

12022.109

330

36.431

 

 

합계

12752.485

332

 

 

 

 

<분산분석>표를 품질과 디자인의 집단-간 유의확률이 .000으로 매우 유의하게 나타납니다.

즉, 브랜드에 따라 품질과 디자인은 유의한 차이를 보인다고 할 수 있겠죠.

 

다중 비교

종속 변수

(I) 회사

(J) 회사

평균차(I-J)

표준오차

유의확률

95% 신뢰구간

하한값

상한값

품질

Scheffe

A

B

-3.9000*

.7367

.000

-5.711

-2.089

C

-5.6183*

.6733

.000

-7.274

-3.963

B

A

3.9000*

.7367

.000

2.089

5.711

C

-1.7183

.7240

.061

-3.498

.062

C

A

5.6183*

.6733

.000

3.963

7.274

B

1.7183

.7240

.061

-.062

3.498

디자인

Scheffe

A

B

-1.5128

.8478

.205

-3.598

.572

C

-3.4574*

.7752

.000

-5.364

-1.551

B

A

1.5128

.8478

.205

-.572

3.598

C

-1.9446

.8316

.066

-3.990

.100

C

A

3.4574*

.7752

.000

1.551

5.364

B

1.9446

.8316

.066

-.100

3.990

 

사후분석인 <다중비교>결과입니다.

품질에 대한 결과를 보면 A와 B사의 평균 차이는 -3.9이고, 유의확률이 .000이므로 차이가 있습니다. 두 평균차이 값에 표시된 별표는 유의수준 .05에서 유의한 차이를 나타내는 것을 아시죠?

B와 C사의 품질은 유의한 차이를 보이지 않았습니다.

디자인의 경우에는 A와 C사만이 유의한 차이를 보이고 있습니다.

동일 집단군

품질

 

회사

N

유의수준 = 0.05에 대한 부집단

 

1

2

3

Duncana,b

A

117

153.878

 

 

B

90

 

157.778

 

C

127

 

 

159.496

유의확률

 

1.000

1.000

1.000

동일 집단군

디자인

 

회사

N

유의수준 = 0.05에 대한 부집단

 

1

2

Duncana,b

A

116

75.883

 

B

90

77.396

 

C

127

 

79.340

유의확률

 

.066

1.000

Duncan의 다중범위 검정에 의해 유의한 차이가 없는 집단을 <동일 집단군>으로 묶은 결과를 보겠습니다.

품질과 디자인에 대하여 Scheffe와 Duncan의 결과는 약간 다릅니다.

품질은 브랜드 별로 모두 유의한 차이가 있어 동일 집단으로 속하지 않았습니다.

디자인은 A사와 B사가 동일 집단으로 속하였지만, C사는 나머지 브랜드 사와 유의한 차이가 있는 것으로 나타났습니다.

즉, 같은 집단에 걸쳐 있으면 그 집단 간에는 유의한 차이가 없다고 할 수 있고,

같은 집단에 걸쳐 있지 않으면 그 집단 간에는 유의한 차이가 있다고 할 수 있는 것이죠.

논문에 기재할 표는 아래와 같이 정리해 주시면 됩니다.

 

종속변수

브랜드

표본수

평균

표준편차

F통계량

유의확률

품질

A

117

153.9A

5.9

35.947

.000

B

90

157.8B

5.3

C

127

159.5C

4.6

디자인

A

116

75.9A

5.2

10.024

.000

B

90

77.4A

6.7

C

127

79.3B

6.3

Post-hoc analysis : A<B<C

오늘도 일과 학업을 함께 하시는 파트타임 여러분들 퐈이팅 입니다.~~~!!

 

#분산분석 #일원분산분석 #ANOVA #독립표본t검정 # #카이제곱 #카이스퀘어 #박사논문 #석사논문 #학술논문 #SPSS #AMOS #구조방정식 #회귀분석 #논문통계 #통계분석 #데이터분석

 

'SPSS' 카테고리의 다른 글

분산분석(반복측정 분산분석)  (1) 2019.11.07
분산분석(이원 분산분석)  (1) 2019.10.30
대응표본 t 검정  (0) 2019.09.19
독립표본 t검정  (0) 2019.09.10
카이스퀘어 검증(교차분석)  (0) 2019.09.10

관련글 더보기