상세 컨텐츠

본문 제목

카이스퀘어 검증(교차분석)

SPSS

by Damon, Kim 2019. 9. 10. 14:57

본문

 

집단 간 비율비교, 교차분석(Crosstabs)

 

교차분석은 명목척도나 순서척도 변수인 두 개의 변수들 간의 연관성을 알아보기 위한 분석입니다.

X2 검정은 교차분석 후 집단 간 차이가 유의한지를 판단하는 것으로 교차분석과 별도로 분석하는 것이 아니라

교차분석을 진행하면서 카이스퀘어 검정에 대하여 분석을 추가로 실시하는 것이죠.

예를 들면

술을 좋아하는 것과 흡연이 어떤 상관이 있는가?

성별에 따라 정당에 대한 지지도가 다른가?

교차분석을 위해서는 대체적으로 10개 이내로 변수값의 개수가 작아야 해요.

교차표를 만들고자 할 때 두개의 변수가 명목척도 혹은 순서척도인 이유도 이러한 것인데,

구간, 비율척도라도 변수값의 갯수가 몇 개 안되거나 변수값을 코딩변경해서 순서 척도로 바꾸면 교차분석이 가능하답니다.

예를 들면

연령에 있어 원래 구간, 비율척도로써 갯수가 많겠지만,

1)20세미만 2)20세~39세 3)40세~59세 4)60세 이상의 그룹으로 코딩을 변경하면 순서척도가 됩니다.

그럼 교차분석을 실시해 보겠습니다.

예를 들어 다음과 같은 가설에 대하여 검증해 볼게요.

성별에 따라 정당 지지도에 차이가 있는가?

H : 성별에 따라 정당 지지 비율에는 유의한 차이가 있다.

 

SPSS에서 분석 - 기술통계량 - 교차분석

새창에서 종속변수 클릭 (정당지지도) - 행으로 이동 - 독립변수 클릭(성별) - 열로 이동

통계량 클릭 - 카이제곱 체크 - 람다체크 - 계속

셀 클릭 - 열(퍼센트) 클릭 - 확인

*분석시 람다체크를 했는데 두 변수 모두가 명목척도인 경우에는 람다를 체크하고,

두 변수 모두가 순서척도 이상인 경우에는 감마를 일반적으로 사용합니다.

카이스퀘어 통계량은 두 변수간 연관성이 있냐 없냐를 알 수 있고, 연관성이 얼마나 큰지는 알 수 없어요.

그래서 독립성 검정의 결과로써 연관성이 있다고 판단되면 연관성의 정도(람다, 감마)를 알기 위해서 실시하는 것입니다.

카이제곱 검정

 

자유도

점근 유의확률 (양측검정)

Pearson 카이제곱

79.277a

2

.000

우도비

95.463

2

.000

유효 케이스 수

474

 

 

a. 0 셀 (.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 12.30입니다.

 

<카이제곱 검정> 결과표를 보면 카이제곱 값에 대한 유의확률은 .000이므로

성별에 따라 정당 지지도는 통계적으로 유의한 차이가 있다고 할 수 있습니다.

정당 구분 * 성별 교차표

 

성별

전체

여자

남자

직종구분

A정당

빈도

206

157

363

성별 중 %

95.4%

60.9%

76.6%

B정당

빈도

0

27

27

성별 중 %

.0%

10.5%

5.7%

C정당

빈도

10

74

84

성별 중 %

4.6%

28.7%

17.7%

전체

빈도

216

258

474

성별 중 %

100.0%

100.0%

100.0%

<정당 구분 * 성별 교차표>의 %를 비교해 보면

A정당은 여자(95.4%)가 높고, B정당은 남자(10.5%), C정당은 남자(28.7%)로 지지도가 높게 나타났습니다.

카이스퀘어 검정결과(p<.001)에 의해 성별에 따라 정당 지지도가 다르다고 할 수 있습니다.

방향성 측도

 

점근 표준오차a

근사 T 값b

근사 유의확률

명목척도 대 명목척도

람다

대칭적

.150

.054

2.590

.010

정당지지도 종속

.000

.000

.c

.c

성별 종속

.227

.078

2.590

.010

Goodman과 Kruskal 타우

정당지지도 종속

.123

.021

 

.000

성별 종속

.167

.024

 

.000

<방향성 측도>를 보면 성별, 정당지지가 모무 명목척도라 연관성 정도는 람다 입니다.

정당 지지도를 모르는 상태 비해서 정당 지지도를 아는 상태에서 성별을 예측할 때 나타나는 예측오류 감소율(람다)는 .227입니다.

람다 값의 근사유의확률은 .010으로써 유의수준 .05보다 작기 때문에 연관성이 유의하다고 할 수 있어요.

그런데 카이스퀘어 검정 결과가 유의하지 않게 나온다면 난감하죠~~

이럴 경우 비슷한 유형끼리 묶어서 분석할 수 있습니다.

다른 변수로 코딩을 변경하는 것인데요,

예를 들면,

1)사무직 2)현장직 3) 영업직 4)주부 등등이 있을때 다룬변수 코딩변경으로 "직장인"으로 직업을 묶어버리는 거죠.

이처럼 표분 수가 비교적 적은 집단을 찾아서 비슷한 유형끼리 묶어주면 카이스퀘어 값이 유의하게 나올 수도 있습니다.

위 분석 데이터를 논문에 기재는 표는 다음과 같이 하시면 됩니다.

 

 

 

성별

전체

X2

p

남자

여자

A정당

206(95.4)

157(60.9)

363(76.6)

79.277

.000

B정당

0(0.0)

27(10.5)

27(5.7)

C정당

10(4.6)

74(28.7)

84(17.7)

전체

216(100.0)

258(100.0)

474(100.0)

 

 

 

X2 위 첨자로 해주세요~~~^^

오늘도 일과 학업을 함께 하시는 파트타임 여러분들 퐈이팅 입니다.~~~!!

 

 

#교차분석 #카이제곱 #카이스퀘어 #박사논문 #석사논문 #학술논문 #SPSS #AMOS #구조방정식 #회귀분석 #논문통계 #통계분석 #데이터분석 #데이터분석

 

'SPSS' 카테고리의 다른 글

대응표본 t 검정  (0) 2019.09.19
독립표본 t검정  (0) 2019.09.10
신뢰도 분석  (0) 2019.09.09
요인분석  (0) 2019.09.09
빈도분석  (0) 2019.09.09

관련글 더보기