728x90

1. 교차분석의 필요성

교차 분석은 보통 크로스탭(crosstab) 분석으로도 불리우며, 2개의 명목 혹은 서열형 척도를 변수로 분석에 활용합니다. 즉 한 변수의 범주를 다른 변수의 범주와 교차 시키고 각각 교차된 경우에 해당하는 셀의 빈도를 분석하는 방법입니다. 아래한글이나 엑셀에서 흔히 작성하여 빈도 수나 퍼센트를 보는 교차 표를 생각하시면 되겠습니다.

 

남자

여자

합계()

자동차 있음

1) 15

2) 20

35

자동차 없음

3) 30

4) 12

42

합계()

45

32

77

간단한 예를 보면 성별(남자/여자)과 자동차 보유(있음/없음)이라는 두개의 명목 척도를 각각 교차시킬 경우 1) ~ 4)와 같이 빈도를 포함하고 있는 총 4개의 셀(cell)을 도출할 수 있으며, 각 셀별 빈도 수에 기반하여 셀별 퍼센트를 구할 수 있을 것입니다실제 교차분석은 매우 간단함에도 불구하고 마케팅 조사에서 다양하게 이용될 수 있습니다. 일예로 소비자의 성별로 선호하는 브랜드를 조사한다거나, 소비자의 소득수준에 따라 자주 방문하는 백화점을 조사하는 등 다양하게 활용됩니다.

2. 교차 분석의 이해

교차분석을 통하여 각 범주별 빈도의 차이를 분석할 수 있습니다. 그러나 실제 이런 차이가 실제 통계적으로 유의한지는 어떻게 알 수 있을까요? 이런 목적을 위하여 교차 분석은 상황표를 이용하여 명목척도로 측정된 두 변수들이 서로 관련이 있는지 알아봅니다. 예를 들어, 이에 대하여 조금 더 자세히 살펴보도록 하겠습니다.

A기업은 글로벌 마케팅 전략을 수립하기 위하여 국가별로 소비자들이 선호하는 스마트폰 브랜드에 관한 조사를 실시하였습니다. 이에 따라 한국, 미국, EU의 세 국가를 선정하였고 각 국가의 소비자들이 삼성, 애플, 그리고 노키아 중 어떤 브랜드를 선호하는지 조사하였습니다조사한 결과는 아래 표와 같은데, 예를 들면 한국에서는 총 100명중 70명이 삼성 제품을 선호하고 있는 것을 알 수 있습니다. 이와 같은 빈도를 실제로 관측된 관측 빈도라고 합니다

 

삼성(B1)

애플(B2)

노키아(B3)

소계

한국(A1)

30

55

15

100

미국(A2)

40

60

20

120

EU(A3)

30

35

15

80

소계

100

150

50

300

그러나 만들어진 교차표 만을 가지고는 실제로 이런 집단간 차이가 브랜드간의 차이때문에 발생된 것이며, 통계적으로 유의한 것이라고 확신하기는 어렵습니다. 예를 들어 삼성 제품의 미국과 EU 지역내 판매 댓수에는 차이가 있기는 하지만, 이런 차이가 브랜드와 관련없는 다른 이유 때문에 우연히 발생했을 가능성도 있기 때문입니다. 이러한 의문에 답하고, 교차표의 결과가 통계적으로 유의한지 확인하기 위해서는 카이제곱의 독립성 검증을 해야 합니다.

3. 카이제곱 검증의 계산절차

카이제곱 검정을 하기위해서는, 우선 각 셀의 기대 빈도를 구해야 합니다. 기대 빈도는 결합 비율(combined proportion)’을 구한 후, 구해진 결합 비율을 각 셀에 곱함으로서 구할 수 있습니다. 일예로, 삼성(B1)과 한국(A1)을 결합한 결합 비율은 다음과 같은 동시 확률로 구해질 수 있습니다. ,

P(A1, B1) = P(A1) * P(B1) 이며, 이를 대입하면

P(A1) = 100/300,

P(B1) = 100/300,

P(A1) * P(B1) = (100/300) * (100/300) = 1/9 이며,

구해진 값을 전체의 총합(300)에 곱할경우, 300 * (1/9) = 33.3 이라는 삼성(B1)과 한국(A1)을 결합한 셀의 기대 빈도가 도출됩니다.

이를 다른 셀에도 동일하게 반복할 경우 다음과 같은 관측빈도와 기대빈도의 교차표를 얻을 수 있습니다. 아래 표가 의미하는 바는 두 변수가 상호독립적일 때, 즉 국가별로 선호브랜드가 동일할 때, 한국에서 삼성 브랜드가 구매될 빈도는 33.3이라는 의미입니다. 이제 브랜드와 국가라는 두개 변수간의 관련성 여부는 관측빈도(30)와 기대빈도(33.3)를 비교하여 그 차이를 카이 제곱 검증을 통하여 검정해 보면 알 수 있습니다.

 

삼성(B1)

애플(B2)

노키아(B3)

소계

한국(A1)

관측 : 30

기대 : 33.3

관측 : 55

기대 : 50

관측 : 15

기대 : 16.7

100

미국(A2)

관측 : 40

기대 : 40

관측 : 60

기대 : 60

관측 : 20

기대 : 20

120

EU(A3)

관측 : 30

기대 : 26.7

관측 : 35

기대 : 40

관측 : 15

기대 : 13.3

80

소계

100

150

50

300

카이제곱 검증을 하기 위해서는 귀무 가설과 대립 가설이 수립되어야 합니다. ,

H0(귀무가설) = 국가간의 브랜드의 차이는 없다.

H1(대립가설) = 국가간의 브랜드 차이는 있다.

라는 가설을 세우고, 귀무가설이 참인지 아닌지를 카이제곱 검증으로 검정을 하게 됩니다.

d. 카이제곱 통계량 계산

만일 귀무가설이 참이라면 카이 제곱 통계량의 표본 분포는 카이제곱 분포로 알려진 연속 곡선에 접근하게 됩니다카이제곱의 통계량을 구하기 위해서는 아래 수식을 사용해야 합니다.

이 식을 이용하여 각 셀의 계산을 반복하면 카이 제곱(x2) 값인 2.25를 얻을 수 있습니다. 직접 손 계산을 해보시기 바랍니다.

카이제곱 값을 이용하여 가설을 검증하기 위해서는 카이 제곱 값, 카이제곱 통계표, 그리고 자유도의 3가지가 필요합니다. 카이제곱 값은 관측빈도와 기대빈도 값을 이용하여 이미 2.25를 구하였습니다. 이제 자유도를 구할 차례입니다카이제곱의 분포는 그 본포의 모양이 '자유도(D.F)'에 따라 달라지는 특성이 있으므로, 자유도를 먼저 확인해야 합니다. 카이제곱 통계량에서 자유도는 교차표의 행의 수와 셀의 수에 의하여 결정됩니다. 그 공식은,

자유도 = (행의 수 - 1) * (열의 수 - 1) 이며, 위 예에 대입하면 행과 열이 각각 3개씩이므로;

= (3-1)*(3-1) = 4 의 자유도를 갖습니다.

이제 구한 자유도(4)와 카이제곱 값(2.25)을 가지고 카이제곱 통계표에서 유의수준 0.05에서 확인할 수 있는 카이 제곱의 임계치는 9.49입니다. 본 분석에서 구한 값이 2.25로 임계치인 9.49보다 작으므로 “H0(귀무가설) = 국가간의 브랜드의 차이는 없다는 채택이 되게 됩니다. 이 결과에 따라서 국가별로 판매되는 스마트폰 브랜드의 비율에는 통계적인 차이가 없다는 것을 알게 되었습니다. 실제 SPSS에서는 이런 비교의 번거로움을 덜어주기 위해서 카이제곱 값과 더불어 검정 결과를 유의도 값으로 제공합니다.

728x90

4. 분석을 위한 설문과 데이타

비교적 간단한 계산을 통하여 교차표를 구하고 카이제곱 검증을 할 수 있으나 SPSS는 이런 통계적 지식에 대한 기본적인 이해만 있다면 누구나 손쉽게 교차분석을 할 수 있도록 지원하고 있습니다. SPSS를 이용하여 지금까지 배웠던 교차 분석을 직접 해보도록 하ᅟᅦᆻ습니다.

우선 본 실습에 사용될 2개의 상호 관련성이 있는 설문 문항을 선택하여야하며, 문항들은 명목 혹은 서열 척도로 구성되어있어야만 합니다. 본 분석에서는 설문 1페이지의 캠코더 브랜드를 묻는 C-2-A)번 문항과 해당 제품의 구입 이유를 물어보는 C-2-D)번 문항을 이용하고자 합니다. 이를 통하여, 캠코더 브랜드별로 제품 구매 이유가 어떻게 다른지 확인해 보도록 하겠습니다이 문항들은 모두 명목척도로서, 교차분석에 적합한 것으로 판단되었습니다.

5. 교차분석 및 결과

이제 직접 SPSS를 이용한 분석을 해보도록 하겠습니다. 우선 데이타 파일을 여신 후, 캠코더 상표(변수명: c2)와 캠코더 구입이유(변수명: c5)를 확인하십시요. 교차 분석을 위해서는 2개의 명목 혹은 서열 척도가 필요합니다.

1) 교차분석 메뉴의 실행: 교차분석을 수행하기 위해서는 우선 메뉴바의 분석(A) -> 기술통계량(E) -> 교차분석(C)를 차례로 클릭해주시기 바랍니다. 이를 모두 실행하면 교차분석 대화상자가 나타납니다.

2) 분석대상 변수의 선택:  아래 그림과 같이 대화상자에서 분석할 변수인 상표(변수명: c2)’를 선택한 후 오른쪽의 '(w) 변수상자에 보냅니다. ‘캠코더 구입이유(변수명: c5)’(C) 변수상자에 보냅니다이때 어떤 특정 변수가 반드시 행으로가고 다른 변수가 열로 가야하는 법칙은 없습니다. 행과 열을 바꾸어서 지정하여도 상관이 없습니다.

3) 옵션의 조정: 이 단계까지 마치고 바로 확인을 누를 경우 교차표를 구할 수 있습니다. 그러나 교차표에는 단지 빈도만이 표시되고 퍼센트가 표시되지 않아 매우 불편합니다. 따라서 보통의 경우 퍼센트가 같이 제시되도록 옵션을 조정한 후 분석을 시행합니다화면 우측의 (E)' 버튼을 눌러보시기 바랍니다.

선택할 수 있는 몇가지 옵션들이 보입니다. 우선 관측빈도와 기대빈도를 선택할 수 있고, 그 밖에 여기서 퍼센트 지정이 가능합니다. (R) 퍼센트의 경우 행 각각의 합이 100%가 되도록 계산을 해주는 반면, (C) 퍼센트는 열 각각의 합이 100%가 되도록 계산을 해줍니다. 본 사례에서는 상표별 구매이유가 주된 관심사항이며, 상표 정보가 행에 위치하므로 행 퍼센트 옵션을 선택합니다. 별도의 카이제곱 통계량이 필요한 경우에는 통계량옵션에서 카이제곱을 선택하신후 분석을 하시면 됩니다.

4) 분석의 시행 및 결과: 이제 교차분석을 시행해 보도록 하겠습니다. 도출된 교차표를 보면 크게 빈도와 기대빈도, 그리고 퍼센트와 관련된 정보를 주고 있습니다. 소니와 삼성을 비교해보면, 소니를 구매한 소비자중 구입한 이유로 가장 중요한 것은 최초 구매(52.2%)’이며, 삼성은 최초 구매 비중이 63.6%로서 소니보다 다소 더 높은 것을 알 수 있습니다. 이를 통해서 초보자가 보다 삼성을 선택하는 경우가 많음을 알 수 있습니다.

추가로 이런 퍼센트의 차이가 브랜드간에 통계적으로 유의한 것인지를 살펴보기 위하여 카이 제곱 통계량을 도출하도록 옵션에서 명령을 부여한 바 있습니다. 카이제곱 검정 결과를 보면,자유도가 35일 때, 카이제곱 유의확율값이 0.606입니다. 이는 P 값이 0.05보다 크므로 유의수준 5%에서 유의하지 못함을 알 수 있습니다. 따라서, 대립가설을 기각되고, 브랜드와 구입이유라는 두 변수는 상호독립적이라는 귀무가설이 채택되게 됩니다. 다시말하면 구입이유와 브랜드간에는 통계적으로 유의한 관계는 없다고 할 수 있습니다. 삼성과 소니 브랜드간 나타난 구입 이유는 브랜드의 차이 때문이라고 할 수 없는 것입니다.

5) 상표전환율 매트릭스의 응용: 교차 분석은 조사자의 목적에 따라 다양하게 활용될 수 있는 실무적 가치가 높은 분석방법입니다. 교차 분석을 응용한 한가지 예로, 상표전환율 매트릭스를 볼 수 있습니다. 상표 전환율 매트릭스는 기존의 특정 브랜드를 가지고 있는 소비자가 다음 구매시점에서는 어떤 브랜드를 구매할 지를 비교 분석함으로서, 소비자가 특정 브랜드에 대하여 가지고 있는 브랜드 로열티수준을 직접 확인하고 타 브랜드와 비교평가할 수 있습니다.

상표전환율 매트릭스를 만들기 위해서는 두개의 질문이 설문지상에 존재하여야 합니다. 하나는 현재 보유한 브랜드와 관련된 문항이며, 또다른 하나는 향후 구매 예정 브랜드에 관련된 문항입니다. 본 실습설문지에도 이런 문항이 포함되어 있습니다. 현재 보유 브랜드를 묻는 1페이지의 C-2-A)번 문항과 미래 의도 브랜드를 묻는 13페이지 C-28-A)번 문항입니다. 이 두 개 변수를 이용하여 상표전환율 매트릭스를 작성할 경우, 현재 보유브랜드를 중심으로 퍼센트를 구하게 되면, 얼마나 많은 고객들이 경재사로부터 이탈하거나 새로 유입이 될지 확인할 수 있으며, 효과적인 브랜드 관리나 고객 로열티 구축을 위한 기초 자료로 활용할 수 있습니다.

우선 소비자의 로열티 수준을 점검해 보겠습니다. 로열티는 쉽게 표현하면, 특정 고객이 재구매 시점에서 같은 브랜드를 사는 재구매경향을 의미합니다. 이 표를 분석하면 가장 로열티나 높은 회사는 소니로서 77.1%에 달하고 있지만 삼성은 고작 40.0 수준에 머물고 있는 것을 볼 수 있습니다.

* 교차분석에 관한 내용을 유튜브 동영상으로 다시 확인하고 싶으신 경우에는 아래 링크 이용바랍니다.

https://youtu.be/CKAhrNfyg28

: 청주대학교 이 원준 (meetme77@naver.com)

 

728x90

+ Recent posts