728x90

1. 다중응답분석의 이해

이제 교차분석에 대하여 이해하셨으리라 기대됩니다. 본 차시의 마지막으로 다중응답 결과를 이용한 교차 분석에 관하여 살펴보도록 하겠습니다. 우선 다중응답(multiple response)'의 개념을 간략히 살펴보도록 하겠습니다. 다중응답이란 응답자가 여러 보기중에서 2개 이상의 복수 선택을 할 수 있도록 허용한 설문 문항을 의미합니다. 보통 설문지에서는 아래 설문과 같은 형태로 물어보게 됩니다.

다중응답 설문 문항이 사용되는 경우는 크게 두가지 경우로 나누어집니다.

첫째, 설문 문항의 성격에 따라서 단 하나의 보기만을 고르도록 하는 것이 적절하지 않은 경우입니다. 일예로 위 문항처럼 주로 무엇을 사진으로 남기는지 물어본다면 아마 대부분의 사람들은 자녀나 풍경, 행사 중에서 하나만을 선택하기가 매우 어렵다고 느낄 것입니다.

둘째, 보기의 숫자가 너무 많아서 응답자가 여러개의 답을 고르도록 하는 것이 보다 정보의 질을 높일 것이라고 생각되는 경우입니다. 아래 설문 문항처럼 보기의 수가 많은 경우에는 각 선택 보기들의 중요도가 서로 비슷한 수준인 경우가 많아 가장 중요한 것 하나를 고르는 것이 큰 의미가 없을 수 있습니다.

이럴 경우에는 다중응답을 허용하여, 응답자가 보다 손쉽게 답할 수 있도록 하는 동시에 정보의 질을 높이는 것이 더 효과적일 수 있습니다. 다중응답은 빈도분석이나 교차분석과 마찬가지로 명목이나 서열 척도만이 분석될 수 있습니다.

다중응답으로 얻어진 결과들을 분석할 때는 기존의 빈도나 교차분석과 다른 프로세스가 필요합니다. 다시 아래 설문 문항을 보시기 바랍니다.

이 설문 문항 C-11)은 문항은 하나지만 2개의 선택을 받을 수 있으므로 실제로 SPSS의 변수 보기창을 보면 2개의 변수로 구성되어 있음을 알 수 있습니다. SPSS 변수보기 창을 살펴보시기 바랍니다.

따라서, 이 변수들을 빈도 혹은 교차분석한다면, 두개의 결과물을 받을 수 밖에 없습니다. 그리고 결과 해석에서도 일관성있게 해석하는 것이 매우 어렵습니다.

이런 문제를 해결하기 위하여 다중응답 분석에서는 두개의 변수에서 도출된 빈도수를 합산하여 하나의 테이블로 만든 후 다시 계산해줍니다. 즉 주촬영대상의 1순위에서 자녀의 빈도는 61명이고 2순위에서 자녀의 빈도는 12명이었지만, 새로만들어진 다중응답표에서의 자녀의 빈도는 61+12= 73명이 될 것입니다. 이런 동일한 과정을 반복하여 통합된 결과표를 만들어주는 것이 다중응답입니다.

728x90

2. 다중응답분석 분석

현재 SPSS상에서 다중응답을 이용하여 빈도분석이나 교차분석을 하기 위해서는 분석(A) -> 다중응답(U)을 차례데로 클릭하셔야 합니다. 다중응답 메뉴로 들어가면 크게 변수군 정의(E)와 더불어 빈도분석(F)', '교차분석(C)' 3가지 메뉴가 이용가능합니다.

그런데, ‘변수군 정의를 제외하고 교차분석 빈도분석은 명령어 아이콘이 어둡게 비활성화되어 있는 것을 볼 수 있습니다. 이는 아직 다중응답분석에 사용해야 하는 변수가 정의되지 않았기 때문입니다.

두개이상의 변수를 새로 계산하여 하나의 변수로 만든다는 것은 결국 새로운 변수가 하나 추가로 생성됨을 의미합니다. , 다중응답 문항을 먼저 통합하여 하나의 변수화하는 과정이 필요하며, 이것을 가능하게 하는 메유가 변수군 정의(E)' 메뉴입니다.

C-11) 문항을 다중응답 분석하기 위아여 이를 클릭해보도록 하겠습니다. 클릭하면 바로 다중응답 변수군 정의 대화상자를 볼 수 있습니다. 이 대화상자를 이용하여 새로운 다중응답 변수를 만들어 보겠습니다.

우선 좌측의 변수군 정의 화면에서 분석에 포함될 다중응답변수들을 클릭하여 좌측의 변수군에 포함된 변수(V)’의 공란으로 옮겨와야 합니다. 즉 어떤, 그리고 몇개의 변수들을 통합하여 하나의 다중응답 변수로 전환할지 지정해주어야 합니다. 본 문항에서는 1순위와 2순위의 2개 복수응답이 가능하므로 해당되는 2개의 변수들을 포함시켰습니다.

그 다음 단계로, ‘변수들의 코딩형식에서 변수 값, 즉 해당 문항에 보기가 몇개인지를 범위 값으로 지정해 주어야 합니다. C-11) 문항을 보면 촬영 대상으로서 1) 자녀 ~ 7) 기타까지 총 7개가 있습니다. 따라서 범위의 최소값으로 ‘1’, 최대값으로 ‘7’을 지정합니다. 만일 보기가 10)까지 있었다면 10을 최대값으로 지정합니다.

그리고, 새롭게 생성된 변수에 아직 이름이 없으므로 변수명을 지정하고 설명을 달아줍니다. 본 사례에서는 변수명을 ‘zz1'으로 지정하였습니다이제 모든 설정이 완료된 이후에는 추가 버튼을 누르면 변수의 지정이 완료되는 것을 볼 수 있습니다.

만일 모든 과정에 이상이 없다면 화면은 아래 화면처럼 바뀌고, 대화창 맨 우측의 다중응답변수군(S)'에 새롭게 지정된 변수가 보이게 될 것입니다.

또한 '다중응답(U)' 메뉴의 빈도분석과 교차분석 메뉴가 활성화되어 있는 것을 볼 수 있습니다. 다중응답의 빈도분석이나 교차분석은 일반 교차, 빈도분석과 달리 반드시 이 곳을 통해서만 분석이 가능합니다.

: 청주대학교 이 원준 (meetme77@naver.com)

 

728x90
728x90

1. 교차분석의 필요성

교차 분석은 보통 크로스탭(crosstab) 분석으로도 불리우며, 2개의 명목 혹은 서열형 척도를 변수로 분석에 활용합니다. 즉 한 변수의 범주를 다른 변수의 범주와 교차 시키고 각각 교차된 경우에 해당하는 셀의 빈도를 분석하는 방법입니다. 아래한글이나 엑셀에서 흔히 작성하여 빈도 수나 퍼센트를 보는 교차 표를 생각하시면 되겠습니다.

 

남자

여자

합계()

자동차 있음

1) 15

2) 20

35

자동차 없음

3) 30

4) 12

42

합계()

45

32

77

간단한 예를 보면 성별(남자/여자)과 자동차 보유(있음/없음)이라는 두개의 명목 척도를 각각 교차시킬 경우 1) ~ 4)와 같이 빈도를 포함하고 있는 총 4개의 셀(cell)을 도출할 수 있으며, 각 셀별 빈도 수에 기반하여 셀별 퍼센트를 구할 수 있을 것입니다실제 교차분석은 매우 간단함에도 불구하고 마케팅 조사에서 다양하게 이용될 수 있습니다. 일예로 소비자의 성별로 선호하는 브랜드를 조사한다거나, 소비자의 소득수준에 따라 자주 방문하는 백화점을 조사하는 등 다양하게 활용됩니다.

2. 교차 분석의 이해

교차분석을 통하여 각 범주별 빈도의 차이를 분석할 수 있습니다. 그러나 실제 이런 차이가 실제 통계적으로 유의한지는 어떻게 알 수 있을까요? 이런 목적을 위하여 교차 분석은 상황표를 이용하여 명목척도로 측정된 두 변수들이 서로 관련이 있는지 알아봅니다. 예를 들어, 이에 대하여 조금 더 자세히 살펴보도록 하겠습니다.

A기업은 글로벌 마케팅 전략을 수립하기 위하여 국가별로 소비자들이 선호하는 스마트폰 브랜드에 관한 조사를 실시하였습니다. 이에 따라 한국, 미국, EU의 세 국가를 선정하였고 각 국가의 소비자들이 삼성, 애플, 그리고 노키아 중 어떤 브랜드를 선호하는지 조사하였습니다조사한 결과는 아래 표와 같은데, 예를 들면 한국에서는 총 100명중 70명이 삼성 제품을 선호하고 있는 것을 알 수 있습니다. 이와 같은 빈도를 실제로 관측된 관측 빈도라고 합니다

 

삼성(B1)

애플(B2)

노키아(B3)

소계

한국(A1)

30

55

15

100

미국(A2)

40

60

20

120

EU(A3)

30

35

15

80

소계

100

150

50

300

그러나 만들어진 교차표 만을 가지고는 실제로 이런 집단간 차이가 브랜드간의 차이때문에 발생된 것이며, 통계적으로 유의한 것이라고 확신하기는 어렵습니다. 예를 들어 삼성 제품의 미국과 EU 지역내 판매 댓수에는 차이가 있기는 하지만, 이런 차이가 브랜드와 관련없는 다른 이유 때문에 우연히 발생했을 가능성도 있기 때문입니다. 이러한 의문에 답하고, 교차표의 결과가 통계적으로 유의한지 확인하기 위해서는 카이제곱의 독립성 검증을 해야 합니다.

3. 카이제곱 검증의 계산절차

카이제곱 검정을 하기위해서는, 우선 각 셀의 기대 빈도를 구해야 합니다. 기대 빈도는 결합 비율(combined proportion)’을 구한 후, 구해진 결합 비율을 각 셀에 곱함으로서 구할 수 있습니다. 일예로, 삼성(B1)과 한국(A1)을 결합한 결합 비율은 다음과 같은 동시 확률로 구해질 수 있습니다. ,

P(A1, B1) = P(A1) * P(B1) 이며, 이를 대입하면

P(A1) = 100/300,

P(B1) = 100/300,

P(A1) * P(B1) = (100/300) * (100/300) = 1/9 이며,

구해진 값을 전체의 총합(300)에 곱할경우, 300 * (1/9) = 33.3 이라는 삼성(B1)과 한국(A1)을 결합한 셀의 기대 빈도가 도출됩니다.

이를 다른 셀에도 동일하게 반복할 경우 다음과 같은 관측빈도와 기대빈도의 교차표를 얻을 수 있습니다. 아래 표가 의미하는 바는 두 변수가 상호독립적일 때, 즉 국가별로 선호브랜드가 동일할 때, 한국에서 삼성 브랜드가 구매될 빈도는 33.3이라는 의미입니다. 이제 브랜드와 국가라는 두개 변수간의 관련성 여부는 관측빈도(30)와 기대빈도(33.3)를 비교하여 그 차이를 카이 제곱 검증을 통하여 검정해 보면 알 수 있습니다.

 

삼성(B1)

애플(B2)

노키아(B3)

소계

한국(A1)

관측 : 30

기대 : 33.3

관측 : 55

기대 : 50

관측 : 15

기대 : 16.7

100

미국(A2)

관측 : 40

기대 : 40

관측 : 60

기대 : 60

관측 : 20

기대 : 20

120

EU(A3)

관측 : 30

기대 : 26.7

관측 : 35

기대 : 40

관측 : 15

기대 : 13.3

80

소계

100

150

50

300

카이제곱 검증을 하기 위해서는 귀무 가설과 대립 가설이 수립되어야 합니다. ,

H0(귀무가설) = 국가간의 브랜드의 차이는 없다.

H1(대립가설) = 국가간의 브랜드 차이는 있다.

라는 가설을 세우고, 귀무가설이 참인지 아닌지를 카이제곱 검증으로 검정을 하게 됩니다.

d. 카이제곱 통계량 계산

만일 귀무가설이 참이라면 카이 제곱 통계량의 표본 분포는 카이제곱 분포로 알려진 연속 곡선에 접근하게 됩니다카이제곱의 통계량을 구하기 위해서는 아래 수식을 사용해야 합니다.

이 식을 이용하여 각 셀의 계산을 반복하면 카이 제곱(x2) 값인 2.25를 얻을 수 있습니다. 직접 손 계산을 해보시기 바랍니다.

카이제곱 값을 이용하여 가설을 검증하기 위해서는 카이 제곱 값, 카이제곱 통계표, 그리고 자유도의 3가지가 필요합니다. 카이제곱 값은 관측빈도와 기대빈도 값을 이용하여 이미 2.25를 구하였습니다. 이제 자유도를 구할 차례입니다카이제곱의 분포는 그 본포의 모양이 '자유도(D.F)'에 따라 달라지는 특성이 있으므로, 자유도를 먼저 확인해야 합니다. 카이제곱 통계량에서 자유도는 교차표의 행의 수와 셀의 수에 의하여 결정됩니다. 그 공식은,

자유도 = (행의 수 - 1) * (열의 수 - 1) 이며, 위 예에 대입하면 행과 열이 각각 3개씩이므로;

= (3-1)*(3-1) = 4 의 자유도를 갖습니다.

이제 구한 자유도(4)와 카이제곱 값(2.25)을 가지고 카이제곱 통계표에서 유의수준 0.05에서 확인할 수 있는 카이 제곱의 임계치는 9.49입니다. 본 분석에서 구한 값이 2.25로 임계치인 9.49보다 작으므로 “H0(귀무가설) = 국가간의 브랜드의 차이는 없다는 채택이 되게 됩니다. 이 결과에 따라서 국가별로 판매되는 스마트폰 브랜드의 비율에는 통계적인 차이가 없다는 것을 알게 되었습니다. 실제 SPSS에서는 이런 비교의 번거로움을 덜어주기 위해서 카이제곱 값과 더불어 검정 결과를 유의도 값으로 제공합니다.

728x90

4. 분석을 위한 설문과 데이타

비교적 간단한 계산을 통하여 교차표를 구하고 카이제곱 검증을 할 수 있으나 SPSS는 이런 통계적 지식에 대한 기본적인 이해만 있다면 누구나 손쉽게 교차분석을 할 수 있도록 지원하고 있습니다. SPSS를 이용하여 지금까지 배웠던 교차 분석을 직접 해보도록 하ᅟᅦᆻ습니다.

우선 본 실습에 사용될 2개의 상호 관련성이 있는 설문 문항을 선택하여야하며, 문항들은 명목 혹은 서열 척도로 구성되어있어야만 합니다. 본 분석에서는 설문 1페이지의 캠코더 브랜드를 묻는 C-2-A)번 문항과 해당 제품의 구입 이유를 물어보는 C-2-D)번 문항을 이용하고자 합니다. 이를 통하여, 캠코더 브랜드별로 제품 구매 이유가 어떻게 다른지 확인해 보도록 하겠습니다이 문항들은 모두 명목척도로서, 교차분석에 적합한 것으로 판단되었습니다.

5. 교차분석 및 결과

이제 직접 SPSS를 이용한 분석을 해보도록 하겠습니다. 우선 데이타 파일을 여신 후, 캠코더 상표(변수명: c2)와 캠코더 구입이유(변수명: c5)를 확인하십시요. 교차 분석을 위해서는 2개의 명목 혹은 서열 척도가 필요합니다.

1) 교차분석 메뉴의 실행: 교차분석을 수행하기 위해서는 우선 메뉴바의 분석(A) -> 기술통계량(E) -> 교차분석(C)를 차례로 클릭해주시기 바랍니다. 이를 모두 실행하면 교차분석 대화상자가 나타납니다.

2) 분석대상 변수의 선택:  아래 그림과 같이 대화상자에서 분석할 변수인 상표(변수명: c2)’를 선택한 후 오른쪽의 '(w) 변수상자에 보냅니다. ‘캠코더 구입이유(변수명: c5)’(C) 변수상자에 보냅니다이때 어떤 특정 변수가 반드시 행으로가고 다른 변수가 열로 가야하는 법칙은 없습니다. 행과 열을 바꾸어서 지정하여도 상관이 없습니다.

3) 옵션의 조정: 이 단계까지 마치고 바로 확인을 누를 경우 교차표를 구할 수 있습니다. 그러나 교차표에는 단지 빈도만이 표시되고 퍼센트가 표시되지 않아 매우 불편합니다. 따라서 보통의 경우 퍼센트가 같이 제시되도록 옵션을 조정한 후 분석을 시행합니다화면 우측의 (E)' 버튼을 눌러보시기 바랍니다.

선택할 수 있는 몇가지 옵션들이 보입니다. 우선 관측빈도와 기대빈도를 선택할 수 있고, 그 밖에 여기서 퍼센트 지정이 가능합니다. (R) 퍼센트의 경우 행 각각의 합이 100%가 되도록 계산을 해주는 반면, (C) 퍼센트는 열 각각의 합이 100%가 되도록 계산을 해줍니다. 본 사례에서는 상표별 구매이유가 주된 관심사항이며, 상표 정보가 행에 위치하므로 행 퍼센트 옵션을 선택합니다. 별도의 카이제곱 통계량이 필요한 경우에는 통계량옵션에서 카이제곱을 선택하신후 분석을 하시면 됩니다.

4) 분석의 시행 및 결과: 이제 교차분석을 시행해 보도록 하겠습니다. 도출된 교차표를 보면 크게 빈도와 기대빈도, 그리고 퍼센트와 관련된 정보를 주고 있습니다. 소니와 삼성을 비교해보면, 소니를 구매한 소비자중 구입한 이유로 가장 중요한 것은 최초 구매(52.2%)’이며, 삼성은 최초 구매 비중이 63.6%로서 소니보다 다소 더 높은 것을 알 수 있습니다. 이를 통해서 초보자가 보다 삼성을 선택하는 경우가 많음을 알 수 있습니다.

추가로 이런 퍼센트의 차이가 브랜드간에 통계적으로 유의한 것인지를 살펴보기 위하여 카이 제곱 통계량을 도출하도록 옵션에서 명령을 부여한 바 있습니다. 카이제곱 검정 결과를 보면,자유도가 35일 때, 카이제곱 유의확율값이 0.606입니다. 이는 P 값이 0.05보다 크므로 유의수준 5%에서 유의하지 못함을 알 수 있습니다. 따라서, 대립가설을 기각되고, 브랜드와 구입이유라는 두 변수는 상호독립적이라는 귀무가설이 채택되게 됩니다. 다시말하면 구입이유와 브랜드간에는 통계적으로 유의한 관계는 없다고 할 수 있습니다. 삼성과 소니 브랜드간 나타난 구입 이유는 브랜드의 차이 때문이라고 할 수 없는 것입니다.

5) 상표전환율 매트릭스의 응용: 교차 분석은 조사자의 목적에 따라 다양하게 활용될 수 있는 실무적 가치가 높은 분석방법입니다. 교차 분석을 응용한 한가지 예로, 상표전환율 매트릭스를 볼 수 있습니다. 상표 전환율 매트릭스는 기존의 특정 브랜드를 가지고 있는 소비자가 다음 구매시점에서는 어떤 브랜드를 구매할 지를 비교 분석함으로서, 소비자가 특정 브랜드에 대하여 가지고 있는 브랜드 로열티수준을 직접 확인하고 타 브랜드와 비교평가할 수 있습니다.

상표전환율 매트릭스를 만들기 위해서는 두개의 질문이 설문지상에 존재하여야 합니다. 하나는 현재 보유한 브랜드와 관련된 문항이며, 또다른 하나는 향후 구매 예정 브랜드에 관련된 문항입니다. 본 실습설문지에도 이런 문항이 포함되어 있습니다. 현재 보유 브랜드를 묻는 1페이지의 C-2-A)번 문항과 미래 의도 브랜드를 묻는 13페이지 C-28-A)번 문항입니다. 이 두 개 변수를 이용하여 상표전환율 매트릭스를 작성할 경우, 현재 보유브랜드를 중심으로 퍼센트를 구하게 되면, 얼마나 많은 고객들이 경재사로부터 이탈하거나 새로 유입이 될지 확인할 수 있으며, 효과적인 브랜드 관리나 고객 로열티 구축을 위한 기초 자료로 활용할 수 있습니다.

우선 소비자의 로열티 수준을 점검해 보겠습니다. 로열티는 쉽게 표현하면, 특정 고객이 재구매 시점에서 같은 브랜드를 사는 재구매경향을 의미합니다. 이 표를 분석하면 가장 로열티나 높은 회사는 소니로서 77.1%에 달하고 있지만 삼성은 고작 40.0 수준에 머물고 있는 것을 볼 수 있습니다.

* 교차분석에 관한 내용을 유튜브 동영상으로 다시 확인하고 싶으신 경우에는 아래 링크 이용바랍니다.

https://youtu.be/CKAhrNfyg28

: 청주대학교 이 원준 (meetme77@naver.com)

 

728x90
728x90

1. 빈도 분석의 개요

빈도분석(Frequency)은 데이타의 전반적인 내용들이 도수분포표상에서 어떠한 분포적 특성을 가지고 있는지 요약된 정보를 제공하는 분석입니다. 빈도분석에서 제공하는 분포 관련 정보는 크게 빈도, 중심화 경향치, 그리고 분산도 들입니다. 또한 이 같은 특성치들을 보다 시각적으로 이해하기 쉽도록 도표를 제공할 수 있습니다.

1) 빈도와 중심화 경향

빈도는 우리가 흔히 퍼센트로 표시하는 개념으로서, 각 값들이 출현하는 횟수를 요약한 정보로서, 빈도 분석이 제공하는 가장 기본적인 정보입니다. 또한 빈도분석은 데이타의 중심화 경향(central tendency)을 보여주기도 합니다. 중심화 경향이란 관측된 데이타들이 어떤 형태로 집중되어 있는지를 알아보는 것으로서, 주로 최빈값, 중앙값, 그리고 평균과 같은 지표들을 이용하여 경향을 평가합니다.

- 최빈값(Mode) : 빈도수가 가장 많이 발생한 관측치

- 중앙값(Median): 수치로 이루어진 데이타들을 크기 순서데로 나열하였을 때 가장 중앙에 위치하는 관측치

2) 분산도

분산도(Dispersion)는 관측된 데이타가 흩어져 있는 정도를 말하며, 범위, 평균편차, 그리고 표준편차와 같은 통계량들로 측정합니다.

- 범위(range) : 가장 큰 수치의 데이타와 가장 작은 수치의 데이타간의 차이를 말합니다.

- 평균편차(mean deviation) : 관측치와 산술평균과의 차이들의 평균을 말합니다.

2. 빈도분석의 시행

이제 본격적으로 빈도분석을 시행하기 이전에, 어떤 데이타를 분석할 것인지 먼저 설문지를 살펴보도록 하겠습니다. 우선 아래 설문지 1페이지의 문항 C2에서 물어보는 캠코더의 구매 경험과 관련된 여러가지 질문들을 봐주시기 바랍니다.

우선, 현재 가지고 있는 캠코더의 형태는 어떤지 빈도분석을 통해서 단계적으로 살펴보도록 하겠습니다

1) 빈도분석 메뉴의 실행

빈도 분석을 수행하기 위해서는 우선 메뉴바의 분석(A) -> 기술통계량(E) -> 빈도분석(F)을 차례데로 클릭해주시기 바랍니다. 이를 모두 실행하면 빈도분석 대화상자가 나타납니다.

 

2) 분석대상 변수의 선택

아래 그림과 같이 대화상자에서 분석할 변수인 '형태(변수명 c3)'를 선정한 후 화살표를 클릭해서 오른쪽의 변수(V) 상자로 보냅니다.

3) 옵션의 조정

: 바로 확인버튼을 누르는 것만으로도 성공적으로 빈도분석이 완수되지만, 필요시 선택적으로 분석에 필요한 다양한 옵션들을 지정할 수 있습니다. 간략히 어떤 옵션들이 주요 옵션들 위주로 있는지 살펴보도록 하겠습니다먼저 통계량옵션을 클릭해보시기 바랍니다. 중심화 경향치, 백분위 값, 산포도 등 다양한 통계량을 선택할 수 있습니다.

다음으로 도표 옵션을 살펴보겠습니다. SPSS에서는 기본적으로 막대도표, 원도표, 히스토그램의 3가지 그래프를 제공합니다. 그러나 보통 SPSS에서 그래프를 그리기보다는 SPSS의 결과값들을 엑셀에 옮겨와서 다시 필요한 그래프를 그리는 것이 더 편리하고 고품질의 그래프를 구할 수 있습니다.

4) 분석의 시행

이제 통계량 옵션중 막대도표만을 선택한 후, 분석을 시행하도록 하겠습니다. 분석이 시작되면 다음과 같은 결과들이 나타날 것입니다. 먼저 제시되는 것은 결측치에 관한 정보가 제시됩니다. 결측치란 해당 문항에 대하여 응답하지 않은 사람들을 의미합니다. 분석 결과 결측치가 185명이나 되네요. 아마 집에 캠코더가 없는 사람이 조사 당시 많았던 것 같습니다그리고 간략한 빈도표가 제시됩니다. 각 빈도표를 보면 퍼센트와 유효퍼센트, 그리고 누적 퍼센트의 정보가 제시됩니다. 이중 퍼센트와 유효 퍼센트의 차이를 살펴보면 유효 퍼센트는 무응답한 결측치를 제외하고 구한 비율입니다. 보통 빈도분석에서 유효 퍼센트를 기본적인 정보로 사용합니다. 분석 결과를 보면 준수직형의 캠코더를 구입한 사람의 47.7%, 수평형 36.0%, 수직형 15.0%, 기타 1.4%로 나타나고 있습니다.

그리고, 추가적인 옵션 지정을 통해 구한 그래프의 모습도 보여주고 있습니다. 하지만, SPSS에서 기본으로 제공하는 그래프는 그다지 정교하거나 세련되지 않습니다. 더 좋은 방법은 빈도표를 엑셀로 복사한 이후 다시 그래프를 그리는 것입니다. 단지 ctrl+Cctrl+V만으로 SPSS의 결과물을 엑셀에 손쉽게 복사할 수 있으니 다양하게 활용해 보시기 바랍니다.

728x90

3. 평균 분석의 개요

평균 분석은 기술통계분석의 일종으로서, 평균과 같은 요약된 통계량을 계산합니다. 평균 분석과 빈도분석은 얼핏 유사해보일 수도 있지만, 결정적인 차이점이 있습니다. 빈도분석이 주로 이산적인 변수값들을 다루는 반면에, 평균분석은 연속적인 변수값들을 다룬다는 점입니다. 보다 쉽게 설명하면 이산적 변수들은 더하기, 곱하기, 빼기, 나누기와 같은 사칙연산으로 계산할 수 없는 값들을 의미하지만, 연속적 변수들은 사칙 연산이 가능한 값들을 의미합니다.

일예로, 야구 선수의 등 번호를 생각해 봅시다. 야구 선수의 등 번호는 분명히 번호이지만 이산적 변수들입니다. 등번호 3번인 선수와 17번인 선수를 더하거나 뺴는 것은 아무런 의미가 없기 때문입니다. 그러나 사과 3개와 17개를 더할 경우 20개의 사과가 됩니다. 이는 사칙 연산이 가능한 경우로서 연속적 변수 값의 예입니다 , 빈도분석은 이산적 변수 값, 평균 분석은 연속적 변수 값을 그 분석 대상으로 하고 있습니다. 척도를 중심으로 설명하면, 빈도분석은 주로 명목 척도와 서열 척도, 평균 분석은 주로 등간 척도와 비율 척도를 분석대상으로 합니다.

이중 등간 척도는 간혹 연구자의 목적에 따라서 빈도분석이 이루어질 수도 있지만, 명목과 서열척도는 평균 분석이 시행될 수 없음을 기억하시기 바랍니다.

4. 평균 분석의 시행

이제 본격적으로 평균 분석을 시행하기 이전에, 어떤 데이타를 분석할 것인지 먼저 설문지를 살펴보도록 하겠습니다. 우선 실습 설문지에서 물어보는 연령과 결혼 년수와 같이 개인 인적사항과 관련된 질문들을 중심으로 봐주시기 바랍니다. 연령과 결혼 년수의 평균을 구해보도록 하겠습니다.

1) 평균분석 메뉴의 실행:  평균 분석을 수행하기 위해서는 우선 메뉴 바의 분석(A) -> 기술통계량(E) -> 기술통계(D)를 차례데로 클릭해주시기 바랍니다. 이를 모두 실행하면 기술통계 대화상자가 나타납니다.

2) 분석대상 변수의 선택: 아래 그림과 같이 대화상자에서 분석할 변수인 '가장 연령(변수명 s1)'결혼 기간(변수명 s3)’을 선정한 후 화살표를 클릭해서 오른쪽의 변수(V) 상자로 보냅니다.

3) 옵션의 조정 : 바로 확인버튼을 누르는 것만으로도 성공적으로 평균을 구하기 위한 기술통계 분석이 완수되지만, 필요시 선택적으로 분석에 필요한 다양한 옵션들을 지정할 수 있습니다. 간략히 어떤 옵션들이 주요 옵션들 위주로 있는지 살펴보도록 하겠습니다먼저 옵션을 클릭해보시기 바랍니다. 연구자의 목적에 따라 평균은 물론이고, 표준편차, 분산, 범위 등 다양한 통계량을 선택할 수 있습니다.

4) 분석의 시행: 이제 원하는 옵션을 선택한 후, 분석을 시행하도록 하겠습니다. 만일 별도의 옵션을 선택하지 않았다면 SPSS는 기본 통계량으로 최소값, 최대값, 평균, 그리고 표준편차를 보여줄 것입니다.

그리고 간략한 기술통계량표가 제시됩니다. 표의 내용을 살펴 보면 사례 수(n), 최소값과 최대값, 평균, 그리고 표준편차의 정보가 제시됩니다. 분석 결과를 보면 가장의 평균 연령은 43.8세이며, 평균적으로 결혼한지 9.8년 가량 경과하였음을 알 수 있습니다.

: 청주대학교 이 원준 (meetme77@naver.com)

728x90
728x90

1. SPSS ‘변수 계산의 이해

 원 데이터에 있는 변수들의 수치를 변환하여 새로운 변수 값을 계산하기 위해서는 변수 계산을 하여야 합니다. 변수 계산을 하기 위해서는 메뉴 바에서 변환(T) -> 변수계산(C)을 차례 데로 선택해야 합니다.

변수계산을 선택하였을 경우 아래 그림과 같은 변수 계산 대화 상자가 열릴 것입니다. 이 대화상자는 그 모습이나 기능이 우리가 흔히 사용하는 전자계산기와 거의 유사합니다. 그래서 계산대라고 부르기도 합니다. 계산대의 주요 기능들을 간략히 설명드리면 다음과 같습니다.

a. 변수보기 Box : 변수보기 BoxSPSS의 원 데이터 파일에 있는 모든 변수들을 보여줍니다. 이 변수들을 변수 계산Box로 옮겨옴으로서 새로운 변수를 계산해 낼 수 있습니다.

b. 변수계산 Box : 변수 계산의 결과로 항상 계산 후 새로운 변수가 만들어지게 됩니다. 우측의 '대상변수(T)''대상 변수(T)'에서는 새롭게 만들어지는 변수를 위하여 새로운 SPSS 변수명을 지정해주어야 합니다. 그리고 좌측의 ‘숫자표현식(E)’‘숫자 표현식(E)’에서는 연산자나 함수 등을 이용하여 계산을 행함으로써 새롭게 생성되는 변수들을 정의해주어야 합니다. 즉 변수의 계산이 이루어지는 장소입니다.

c. 연산자 Box: 변수계산에 사용할 수 있는 다양한 연산자와 함수들을 모아놓은 곳입니다. 이들 연산자나 함수들은 ‘숫자표현식(E)’‘숫자 표현식(E)’에서 직접 키보드로 입력할 수도 있으며, 혹은 연산자 Box에서 사용할 함수나 연산자를 클릭하여 사용할 수도 있습니다. 사용할 수 있는 연산자는 산술 연산자,, 논리 연산자,관계 연산자가 있으며, 그외 기타로 여러 함수들을 사용할 수 있습니다.

<산술 연산자>

기본적인 산술 연산을 위한 연산자들이다. 그러나 여러 개의 괄호( )를 사용하는 복잡한 연산을 수행할 때는, 괄호 안의 식이 먼저 계산되므로 주의가 필요하다.

기호

의미

+

-

*

/

**

( )

더하기

빼기

곱하기

나누기

지수

연산의 순서 정함

<관계 연산자>

관계 연산자는 두 값을 비교하는 등 주로 값들 간의 관계를 설정하는 데 사용합니다.

기호

의미

<

>

<

>

=

~=

~보다 지다

~보다 크다

~보다 작거나 같다

~보다 크거나 같다

같다

같지않다

<논리 연산자>

두 개 이상의 관계식을 결합하기 위해 혹은 작성한 조건식을 보다 정교화하기 위하여 논리 연산자를 사용합니다.

기호

의미

& (and)

I (or)

~ (not)

또한

또는

아니면

연산자 외에 다양한 함수들을 이용할 수도 있습니다. SPSS에서는 통계, 산술, 문자, 날짜지정, 분포 등에 관련한 다양한 함수들을 사용할 수 있습니다. 함수들에 관한 상세한 내용이 필요한 경우에는 SPSS에 내장되어 있는 도움말을 참조해보시기 바랍니다.

d. 조건선택 Box: 필요할 경우, 데이터의 변화 과정에 조건식을 사용하여 특정 조건에 적합한 케이스만 선택할 수 도 있습니다. .

2. 변수 계산 실습

이제 변수 계산의 의미와 실행하는 방법에 대하여 간단히 이해하셨으리라 생각됩니다. 이제 실제 사례들을 가지고 직접 실습을 해보도록 하겠습니다. 본 강의를 들으시면서 ’실습 data 01.sav' 파일을 여신 후 직접 따라해보시면 더 쉽게 이해하실 수 있으리라 생각합니다.

a. 간단한 산술 연산으로 새 변수 만들기

가장 기본적인 변수 계산의 예로서 더하기, 빼하기, 곱하기, 나누기 등의 산술 연산자를 이용하여 하나의 새로운 변수들을 만들어보기로 하겠습니다. 우선 분석하기 전에 어떤 상황에서 이런 변수 만들기가 필요한지 실습용 설문지의 예를 들어보기로 하겠습니다.

실습문제1) C-8번 문항을 보면 연간 평균 테이프 사용 분량에 관한 설문 문항을 가지고 있습니다. 만일 이를 월간 사용량으로 바꾸고 싶은 경우 어떻게 해야 할까요?

(답변 1) : ‘연간사용량 / 12’, 즉 연간 사용량을 12개월로 나누어주면 간단히 구할 수 있을 것입니다. 즉 ‘변수계산’ 대화창에서 다음과 같이 입력을 하면 됩니다. 우선 새롭게 변수가 만들어지기 때문에 새로운 변수명을 임의로 지정합니다. 여기서 변수명은 ‘zzz01'입니다그리고 C-8번 문항의 SPSS 변수명은 'c22'이므로 이 변수를 찾아 숫자표현식에 넣고 12개월로 나누어주면 됩니다.

변수계산전과 변수계산후의 결과를 비교해보면, 다음과 같습니다. 연평균 테입 분량은 6.7개 였지만, 월별 소요량으로 변환한 후에는 0.558개로 변한 것을 볼 수 있습니다.

실습문제 2) C-8번 문항을 사용하여 연간 촬영 시간을 구하시오. 단 테입 1개 분량은 60분을 찍을 수 있다고 가정합니다.

답변 2) 연간사용량 * 60을 하면 간단하게 촬영시간을 구할 수 있으며, 분석 결과는 연간 402.2분의 시간을 촬영하고 있는 것으로 나타났습니다.

실습문제 3) 캠코더에 대한 소비자 만족도를 조사하기 위하여 아래와 같은 만족도 문항을 7점 척도로 조사하였습니다.

그러나, 보통 과거에는 만족도를 100점 만점으로 평가하였기 때문에 새로운 조사 결과와 과거 조사 결과를 직접 비교하는 것이 곤란해졌습니다. 이 문제를 해결하기 위해서 7점 척도를 100점 만점으로 환산하고자 합니다. , 7점 척도의 1점은 100점 만점의 0, 4점은 50, 7점은 100점이 되도록 환산하십시요.

(답변 3) (변수 - 1) * (100 / 6)와 같은 계산식으로 쉽게 구할 수 있습니다. 여기서 (변수 - 1)을 한것은 7점 척도에서 1점을 선택한 사람의 점수를 0점으로 환산하기 위해서입니다. 그리고 (100 / 6)한 값을 곱해줌으로서 0~ 100점 사이의 값을 갖는 100점 척도로 전환이 가능합니다.

3. ‘코딩 변경의 이해

코딩이란 변수값을 의미합니다. 즉 각 변수들은 구체적으로 변수 값들을 갖습니다. ‘가족내 지위는 하나의 변수이며, 구체적인 변수값으로는 가장, 주부, 자녀, 기타 등의 값을 갖을 수 있습니다.

변수값의 코딩 변경에서는 범주나 분류를 다시 변경하는 방식으로 새로운 변수를 만들거나 기존 변수들을 변경할 수 있습니다, ‘가족내 지위라는 변수를 그대로 유지하면서 변수값만 1(가장), 2(기타)로 간단하게 변경할 수 도 있고, ‘가족내 지위2’라는 새로운 변수를 만들어서 변수값을 1(가장), 2(기타)로 지정할 수도 있습니다.

SPSS는 이 두 가지중 한 방식을 선택하여 변수 값을 변경할 수 있도록 해줍니다. 코딩 변경을 하기위에서는 메뉴 바에서 변환(T) -> 같은 변수로 코딩변경(S), 혹은 다른변수로 코딩변경(R)을 선택하시면 됩니다.

본 수업에서는 다른 변수로 코딩변경하는 방법만을 설명드리도록 하겠습니다. 기본적으로 명령어나 변경 순서가 두가지 방식 모두 동일하기 때문입니다. 아울러, 가능하다면 항상 다른변수로 코딩변경하는 습관을 들이시기 바랍니다. 언제 어떤 상황에서 원본 데이타가 필요할지 모르기 때문에 가능하면 원본 데이타는 훼손하지 않는 것이 좋기 때문입니다.

기존 변수값을 이용하여 새로운 변수로 코딩변경하기 위해서는 우선 변화(T) -> 다른변수로 코딩변경(R)을 차례로 선택하셔서 코딩 변경 대화상자가 나타나도록 해야 합니다.

왼쪽 상자는 데이타에 포함된 모든 변수들을 보여주고 있는데, 이중에서 코딩을 변경할 기존의 변수를 선택한 후, 대화 창의 중앙에 있는 ‘숫자변수(V) ->출력 변수’ Box로 옮깁니다. 여기서는 응답자의 가족내 지위를 표시하는 변수인 'id1'을 선택하였습니다.

변수를 옮긴 후 ‘?’가 표시된 것을 볼 수 있습니다. 이는 코딩을 변경하여 새로운 변수를 만들었기 때문에 새 변수에 필요한 변수명이 현재 없다는 의미입니다. 이제 변수명을 하나 만들어 주도록 하겠습니다변수명을 지정할 때는 대화 창의 좌측에 있는 ‘출력변수’란에 새로운 변수의 이름을 지정해주면 됩니다. 그리고 바꾸기버튼을 눌러 줍니다.

이제 새로운 변수에 기존 변수의 변수값을 코딩만 변경해서 옮겨줄 차례입니다. 이를 위해서는 대화 창 하단의 기존 값 및 새로운 값(O)' 버튼을 눌러주시기 바랍니다.

이를 클릭하면 변수값을 재지정하기 위한 새로운 대화창이 열리게 됩니다. 대화창 좌측의 ‘r기존값(V)' 상자안에 변환 전의 변수값을 입력하고, 창 우측의 ’새로운 값(A)' 상자안에 변환하고자 하는 변수값을 입력한후 추가버튼을 선택합니다. 그러면 기존값이 새로운 값으로 변환된 값이 나타나며, 이를 반복하여 원하는 데로 코딩이 변경된 새로운 변수를 얻습니다본 예시에서는, 1=가장, 2=주부, 3=자녀, 4=기타로 되어있던 기존값을 1=가장, 2=기타로 단순화하고자 하였기 때문에 아래 대화창과 같은 결과를 얻을 수 있습니다.

: 청주대학교 이 원준 (meetme77@naver.com)

 

728x90
728x90

1. SPSS 데이타의 편집

입력이 완료된 이후의 데이타라도 데이타 편집기를 활용하여 얼마든지 추후에 이를 수정할 수 있으며, 필요할 경우 다양한 편집 활동을 할 수 있습니다.

,

- 입력된 변수 값의 삭제나 수정이 가능합니다. 마이크로소프트 엑셀과 같이 직접 커서를 움직여서 새로운 값을 기존 값 위에 입력하거나, 기존 값을 삭제 후 재입력할 수 있습니다.

- 변수 값을 복사하여 옮겨붙이기도 가능합니다. 하나의 셀이나 여러개의 셀, 혹은 행이나 열 단위의 데이타를 삭제하거나 다른 곳에 복사할 수 있습니다.

이처럼 데이타를 편집하기 위해서는 다음과 같은 절차가 필요합니다.

1) 삭제하거나 복사하고 싶은 셀들을 지정합니다. 마우스 오른쪽 버튼을 누르면 한 개의 셀을 지정할 수 있고, 쉬프트키를 누른상태에서 마우스를 누르면 여러개의 셀을 한번에 지정할 수 있습니다.

2) 마우스 오른쪽 버튼을 누르거나 메뉴의 편집(E)에서 잘라내기(T)나 복사(C)를 선택합니다. 잘라내기는 원래 셀로부터 다른 셀로 데이타를 이동함을 의미하며, 복사는 똑같은 셀의 내용은 다른 셀에 하나 더 만드는 것을 의미합니다.

3) 복사해 붙이기 원하는 셀의 위치에 마우스 커서를 옮깁니다.

4) 마우스 오른쪽 버튼 혹은 메뉴의 편집(E)에서 붙여넣기(P)를 선택합니다.

2. 행과 열의 추가 및 삭제

기존의 파일에 새로운 케이스를 추가하거나 삭제할 수 있습니다. 이를 설명하기 위해서 5차시에서 사용하였던 간단한 설문 문항과 데이타를 다시 보도록 하겠습니다.

문항 1. 당신이 좋아하는 과목은 다음중 무엇입니까 1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다. ________

문항 3. 당신의 성별은 무엇입니까 1) 남성 2) 여성

이런 간략한 설문 조사를 통하여 10명의 응답자로부터 얻은 설문 결과를 데이타 윈도우에 정리한 것이 아래 화면입니다. 그런데 만일, 뒤늦게 학생 1명으로부터 추가적으로 설문지를 받게 되었을 때는 어떻게 해야 할까요? 우선 생각해볼 수 있는 가장 간단한 방법은 마지막 행인 11번째 행에 새로 응답을 받는 학생이 데이타를 추가하면 될 것입니다.

하지만 경우에 따라서는 특정 행에 새로 얻은 설문지를 삽입해야 하는 경우도 생깁니다. 예를 들면 데이타가 학번이나 날짜와 같이 일정한 순서를 가지고 있는 경우들입니다. 만일 첫번째 행과 두번째 행 사이에 새로 얻은 데이타를 추가하고자 할 때의 절차를 살펴보도록 하겠습니다.

1) 행을 추가하기 위해서는 추가하고자 하는 행 번호에 마우스를 왼쪽 클릭한다. 그러면 해당 행 전체가 블록으로 지정된다

2) 마우스 오른쪽 버튼을 누르거나 메뉴의 편집(E)에서 케이스 삽입(I)’을 선택하면 새로운 행이 공란으로 추가되며, 공란의 각 셀은 마침표(.)로 나타납니다. 그리고 기존에 있던 행은 다음 행으로 자동적으로 밀려납니다.

3) 새롭게 생긴 행의 셀이 추가하고자하는 데이타를 입력하면 됩니다.

만일 설문 문항이 증가하거나 변수가 추가되었을 경우에는 어떻게 해야 할까요? 변수가 추가되었을 경우에는 열(column)을 증가시키게 되며, 그 과정은 행(raw)을 추가하는 과정과 동일합니다. 첫번째 변수로 V1이 아니고 설문지의 일련번호를 의미하는 'no'라는 새로운 변수를 추가하는 과정을 살펴보도록 하겠습니다.

1) 열을 추가하기 위해서는 추가하고자 하는 열 번호에 마우스를 왼쪽 클릭한다. 그러면 해당 열 전체가 블록으로 지정된다

2) 마우스 오른쪽 버튼을 누르거나 메뉴의 편집(E)에서 변수 삽입(I)’을 선택하면 새로운 열이 공란으로 추가되며, 공란의 각 셀은 마침표(.)로 나타납니다. 그리고 기존에 있던 열은 다음 열로 자동적으로 밀려납니다.

3) 새롭게 생긴 열의 셀의 설문지의 일련번호인 1~11을 입력하면 됩니다.

3. 데이타의 정리

최근에는 온라인을 통한 설문 조사가 많이 진행되고 있습니다. 온라인으로 조사가 진행될 경우, 대부분 응답자의 응답 결과는 자동으로 SPSS에서 직접 읽어들일 수 있는 파일 포맷인 엑셀이나 txt 형태로 저장됩니다. 그 결과 응답 결과는 별다른 처리없이 신속하게 바로 SPSS에서 사용할 수 있습니다.

그러나 아직은 조사원이 직접 응답대상자를 찾아가서 설문지를 받아오는 전통적인 면대면 방식의 조사 방식이 보다 많이 활용되고 있습니다. 면대면 방식이 더 많은 시간과 비용이 소요되지만 응답자들의 협조를 구하는 것이 용이하고, 조사의 신뢰성도 더 높기 때문에 여전히 선호되고 있습니다.

이런 면대면 방식의 응답 결과는 종이로 인쇄된 설문지를 통하여 얻게되기 때문에, SPSS로 분석하기 위해서는 종이에 적힌 응답 결과를 SPSS가 인식할 수 있도록 직접 키보드를 두들겨서 데이타 윈도우에 값을 입력하거나, 엑셀 혹은 TXT 파일로 작성한 이후에 다시 SPSS로 읽어와야 합니다. 우리는 이 과정을 펀칭(punching)’ 이라고 합니다.

펀칭이라고 부르는 이유는 지금은 생소하지만 60~70년대 컴퓨터 초창기에는 실제로 종이 카드에 천공기로 구멍을 뚫어서 직접 데이타를 입력했기 때문에 그런 이름이 붙었다고 합니다.

그러나, 사람의 손을 거쳐 종이에 적힌 데이타가 컴퓨터가 인식할 수 있는 디지털 파일로 바뀌는 과정에서 착오나 오타로 잘못된 정보들이 입력되는 경우들이 종종 있습니다. 데이타 정리, 혹은 데이타 클린싱(cleansing)은 이런 잘못된 데이타들을 교정해서 바로잡는 과정이라고 할 수 있습니다.

우선 아래 설문지와 입력된 데이타 파일을 비교해보면서 입력이 잘못되었다고 의심할 만한 사례가 있는지 확인해 보도록 하겠습니다.

문항 1. 당신이 좋아하는 과목은 다음중 무엇입니까?   1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다.   ________

문항 3. 당신의 성별은 무엇입니까?   1) 남성 2) 여성 

이미 찾으셨는지요? 이 데이타와 설문지를 비교해보면 10번째 응답자의 V3 변수에 이상이 있는 것을 알 수 있습니다. 실제 V3변수는 응답자의 성별 변수이며, 취할 수 있는 변수 값은 1=남성, 2=여성인데 입력값은‘3’입니다.

이런 오류가 나타날 가능성은 크게 두가지 입니다.

1) 설문 응답자가 실제로 틀리게 ‘3’을 쓴 경우, 혹은

2) 응답자는 1이나 2로 바르게 썼으나 펀칭 과정에서 오타가 발생한 경우입니다.

이를 확인하기 위해서는 실제 종이로된 설문지를 다시 찾아보고 응답 결과를 확인하는 수 밖에 없습니다. 확인시 해당 열에서 오름차순정렬이나 내림차순정렬을 잘 사용하면 이런 작업을 보다 손쉽게 할 수 있습니다.

만일 설문에 응답한 응답자가 수백 혹은 수천명을 넘을 정도로 너무많다면, 이중에서 잘못 펀칭한 설문지를 어떻게 찾느냐고요? 이런 경우를 대비해서 각 설문지에는 설문지 일련번호를 붙일 것을 권장하며, 관습적으로 spss 데이타의 첫번째 변수, 즉 첫번째 열에는 보통 설문지 일련 번호를 부여하게 됩니다.

4. 케이스 선택

이제 데이타의 정리까지 끝났고, 본격적으로 분석할 준비가 되어 있습니다. 그런데 경우에 따라서는 준비된 데이타를 모두 사용하지 않고 데이타 파일의 일부 케이스만 이용하여서 분석을 해야하는 경우가 있습니다.

문항 1. 당신이 좋아하는 과목은 다음중 무엇입니까?   1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다.   ________ 점 

문항 3. 당신의 성별은 무엇입니까?   1) 남성 2) 여성

일예로, 위와 같은 설문조사를 통하여 조사를 완료하고 데이타를 모두 가지고 있지만, 수학 선생님이 특별히 수학과 관련된 내용을 분석하고 싶어할 수도 있고, 혹은 남자의 성적만이 궁금한 경우가 있을 수 있습니다. 이 경우 특정한 케이스만 선택하여 분석을 할 수 있게 해주는 메뉴가 케이스 선택(S)' 입니다.

예로 남학생만의 기말고사 점수를 보고 싶은 경우를 중심으로, 어떤 단계를 거쳐 케이스 선택이 진행되는지 살펴보겠습니다.

1) 메뉴 바에서 데이타(D)'를 선택한 후 차례로 케이스선택(S)'을 클릭합니다. 그려면 아래와 같이 케이스 선택 대화상자가 나타납니다. 케이스 대화상자의 왼쪽 창에서는 데이타 파일에 있는 모든 변수들을 보여주고 있습니다.

2) 여기서 선택가능한 버튼중에서 조건을 만족하는 케이스(C)'를 선택한 후, 다시 바로 밑에 있는 조건(I)' 버튼을 클릭합니다.

 

3) 조건 버튼을 클릭하면 다시 보다 작은 크기의 조건 대화상자가 나타나게 됩니다. 여기서 우리는 남학생만을 선택하여 분석할 것이기 때문에 성별을 나타내는 변수인 'V3' 변수를 클릭한 후 화살표 버튼을 눌러 우측으로 옮겨놓습니다. 그리고 변수 값을 지정하게 됩니다. v3의 변수 값을 보면 1=남자, 여자=2이므로, 'V3=1'을 입력하면 남자만 선택되게 됩니다. 입력하는 방법은 직접 키보드로 입력을 해도되고, 대화 상자 중앙의 전자계산기처럼 생긴 버튼들을 이용하여 입력하여도 됩니다.

4) 자 이제 지정이 끝났습니다. 지정이 잘 끝났는지 확인하려면, 다시 데이타 윈도우로 돌아가 보십시요. 만일 모든 과정이 잘 끝났다면, 데이타 윈도우에서 v3=2, 즉 성별 변수가 여자인 경우에는 행 번호를 보여주는 첫번째 박스에 / 표시가 되어 있는 것을 볼 수 있을 것입니다. 아울러 ‘filter_S'라는 변수가 하나 더 생긴 것을 볼 수 있는데, 0인 변수 값은 분석에 사용하지 않는다는 의미이며, 변수 값이 1인 것은 분석에 사용한다는 의미입니다. 이렇게 지정이 된 이후에는 앞으로 어떤 분석을 하더라도 남자만이 분석에 포함되며 여자는 분석에서 제외될 것입니다.

5) 마지막으로, 케이스 선택은 다시 해제하지 않으면 지속적으로 앞으로의 모든 분석들에 동일한 영향을 미치게 됩니다. 따라서, 남학생을 대상으로한 분석이 끝나고, 다시 남녀 전체를 대상으로 분석을 해야할 경우에는 반드시 먼저 케이스 선택을 해제해주셔야만 합니다. 해제하는 방법은 케이스 선택 대화상자에서 모든 케이스를 선택해주시면 해제가 됩니다.

본 사례에서는 케이스 선택을 이해하기 위하여 남학생만을 선택하는 지극히 간단한 예를 사용하였습니다. 하지만, 케이스 선택 대화상자에서 제공하는 다양한 수식 기호나 함수들을 이용하여 더욱 복잡한 조건들을 사용하여 케이스를 선택하는 것도 가능합니다.

예를 들어서 평균 점수가 80점 이상인 우등생만을 대상으로 분석하고자 할때는 조건 대화상자안에 “v2 > 79'라는 간단한 수식으로 원하는 케이스만을 선택할 수 있으며, 이 수식을 조금 더 응용하면 수학이 50점 미만인 남자와 같이 여러개의 변수들을 같이 사용하여 보다 복잡한 조건을 충족하는 케이스만을 선택할 수도 있을 것입니다.

: 청주대학교 이 원준 (meetme77@naver.com)

728x90
728x90

1. 데이터 파일 생성

SPSS에서 처리할 데이터를 작성하기 위한 방식은 크게 3가지 방식을 사용할 수 있습니다. 첫째 아래한글이나 텍스트 편집기를 이용하여 입력을 받거나, 둘째 엑셀로 준비한 파일을 입력받을 수 있습니다. 그리고 셋째 바로 SPSS의 데이터보기 창에서 직접 데이터를 입력하여 데이터 파일을 만들 수도 있습니다. 세가지 방법 모두 사용 가능하지만,, 보통 사용 목적에 따라 적합한 방식이 있으므로 필요에 따라 선택하여 사용하면 됩니다.

세 가지 문항으로 이루어진 간단한 설문자료를 이용하여 데이터 파일을 생성하는 법을 배워보겠습니다.

문항 1. 당신이 좋아하는 과목은 다음중 무엇입니까?

1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다 ________

문항 3. 당신의 성별은 무엇입니까?

1) 남성 2) 여성

1) 아래한글 혹은 텍스트 입력기를 활용하는 방법

일반적으로 표본의 수가 매우 큰 조사 자료를 입력하는 경우 아래한글 같은 워드프로세서를 입력하여 txtASCII 파일 형태로 자료를 일괄적으로 입력하는 것이 편리합니다. 엑셀이나 SPSS 데이타보기 창에 비하여 이런 워드 프로세서들은 대용량 파일을 빠르게 처리할 수 있기 때문입니다. 간단히 10명의 응답자가 설문에 응답한 예를 들어보면 아래와 같이 설문지의 데이터를 고정 형태로 입력할 수 있을 것입니다.

설문지에 응답한 내용을 아래한글에 옮길 때 주의사항은 미리 각 변수의 자리 수를 생각해두어야 한다는 점입니다. 위 데이타의 첫 번째 응답자를 보면 ‘1 852’로 코딩되어 있습니다. 1은 첫번째 변수인 좋아하는 과목(수학)’이고, ‘85’점수’, 2성별(여성)’입니다. 85앞에 한 칸이 공란으로 띄어져 있는 이유는 점수는 최대 허용 가능한 점수가 100점으로서 최대 3칸의 자릿 수를 차지하기 때문에 100점 맞는 응답자를 대비해서 공간을 맞추어 놓은 것입니다. 본 데이타의 10번째 응답자를 보면 실제로 100점을 맞아 자리 수가 꽉 차 있음을 볼 수 있습니다.

다음 단계로는 이 파일을 아래 한글에서 새로운 이름으로 저장하면서, 파일 형식을 hwp가 아니라 txt로 저장하시면 SPSS에서 불러올 수 있습니다.

SPSS에서는 txt 파일도 다양한 형태로 불러 올 수 있지만, 가장 빈번하게 사용되는 방식을 위주로 설명드리겠습니다. 이제 SPSS를 열고 파일 -> 열기 -> 데이타열기 메뉴를 차례로 클릭하시면 아래와 같은 메뉴가 나옵니다. 이 데이터열기 창에서 저장해놓은 txt 파일을 열어 보겠습니다.

파일을 열면 자동적으로 텍스트 가져오기 마법사가 시행되는데, 우선 텍스트 1단계에서는 텍스트 파일이 사전에 정의된 형식과 일치하는지 확인합니다. 사전에 형식을 정의한 것이 없으므로 아니오를 선택합니다.

그리고 다음 단계로 넘어가면 txt 파일의 데이타가 구분자에 구분되어 있는지 고정 너비인지 묻는 질문이 나옵니다. 각 변수간 구분을 쉼표나 마침 표등 구분자로 하였을 경우에는 구분자에 의한 배열을 선택하지만, 보통 이렇게 하지 않습니다. 쉼표와 같은 구분자를 일일이 변수 사이에 입력하는 경우에는 그 수고가 적지 않기 때문에 보통 위에서 예를 든 것처럼 공간을 일정하게 배분하여 입력을 하게 됩니다.. 이런 경우 마법사 창에서 고정 너비로 배열을 선택하게 됩니다. 아울러 본 텍스트 파일에는 변수 이름이 포함되어 있지 않으므로 변수 이름이 파일의 처음에 있는지 묻는 질문에는 아니오를 선택하면 됩니다.

그 다음에도 몇 가지 단계가 남아 있지만 중요한 사항들은 아니므로 무시하고 계속해서 다음을 누르시면 4단계로 갑니다. 4단계에서는 읽어온 데이터의 자릿수를 구분해서 나눔으로써 변수의 개수를 지정하게 됩니다. 변수를 지정하는 방법은 박스 하단에 있는 데이타에 가서 각 변수에 해당하는 자리에서 마우스를 오른 클릭하면 변수 구분선이 자동 생성됩니다.. 이때 사전에 지정된 변수의 자릿수에 맞게 구분선을 클릭하시면 원하는 변수들을 얻을 수 있습니다. 구분선이 잘못되었을 경우에는 구분 삭제버튼을 누르셔서 취소할 수 있습니다.

완료하시면 이제 아래와 같이 SPSS의 데이타보기 창에 데이터 입력이 자동으로 완성된 것을 볼 수 있습니다. 이를 SPSS상에서에서 다른 이름으로 저장하여 SPSS만의 고유한 확장자인 data.sav로 다시 저장하시면 데이타 불러오기가 완료됩니다.

2) 엑셀을 활용하는 방법

최근에는 보다 보편적으로 엑셀을 활용하여 데이터 파일을 작성한 후 SPSS에서 읽어들이는 방법이 보다 많이 사용되고 있습니다. 그 이유는 우선 엑셀의 경우 엑셀의 열(칼럼) 하나가 하나의 변수에 해당되기 때문에 초보자가 입력 실수를 할 가능성이 아래한글을 이용한 경우보다 적다는 점입니다. 그리고 또다른 이유로 구글이나 인터넷을 활용하여 설문을 실시할 경우 이런 프로그램들은 기본적으로 설문 응답 결과를 엑셀 파일 형태로 저장해주기 때문에 매우 편리하기 때문입니다.

엑셀을 이용하는 경우 엑셀 한 개의 열이 SPSS에서 한개의 변수로 자동적으로 인식됩니다. 즉 아래와 같이 설문 응답한 데이터를 엑셀 차트에 저장한 이후에 data.xls 파일로 저장하면 됩니다. 아래의 엑셀 챠트를 살펴보면 10개의 응답자가 응답한 설문 결과 외에 맨 첫 번째 줄에 a1, a2, a3의 추가된 데이타가 있는 것을 볼 수 있습니다. 엑셀로 저장된 데이타를 불러올 때는 선택적으로 엑셀의 맨 첫 줄에 있는 내용을 변수 명으로 지정하여 불러들일 수 있습니다. 즉 이 엑셀 파일을 SPSS로 불러들이면 SPSS는 자동적으로 a1, a2, a3라는 이름을 가진 세개 변수를 자동으로 만들 것입니다.

이제 SPSS를 열고 파일 -> 열기 -> 데이타열기 메뉴를 차례로 클릭하시면 아래와 같은 메뉴가 나옵니다. 파일 유형을 xls로 변경하신 후 데이터 파일을 열 수 있습니다.

이때, ‘첫행에서 변수 이름 읽기옵션을 선택하시면 엑셀의 첫 줄에 있는 데이터는 데이터가 아니라 변수 이름으로 읽힐 것입니다. 이 과정을 거치면 SPSS의 데이타보기 창에 데이터 입력이 완성된 것을 볼 수 있습니다.

3) SPSS를 활용하는 방법

SPSS데이타보기창을 엑셀 창처럼 활용해서 데이터를 직접 입력할 수 있습니다. SPSS의 데이타보기창의 각 셀에 직접 원하는 데이터를 입력하거나 삭제할 수 있습니다. 이 방법은 가장 간단한 방법이지만, SPSS의 데이타데이터 입력 속도가 아래 한글이나 엑셀에 비하여 현저하게 느리기 때문에 많은 양의 데이터를 처리할 때는 적합하지 않습니다. 다만, 기존의 데이타에 내용을 변경하거나 일부 추가할 때는 유용하게 사용될 수 있습니다.

또한 각 열의 이름인 변수 명이나 각 행의 번호에서 마우스를 오른 클릭하면 특정 열이나 줄을 삽입하거나 삭제할 수 있으며, 정렬할 수 있는 메뉴가 나타납니다. 이를 이용하여 데이터를 정리하는 것도 가능합니다.

2. 변수의 정의

SPSS데이타 보기창은 엑셀과 마찬가지로 데이터 파일을 수정하거나 편집하는 데 있어서 편리합니다. 데이타 보기창은 크게 3가지로 구성되어 있습니다.

1) (row) : 각 행은 설문에 응답한 개인을 나타냅니다. 일예로 100명이 응답한 경우 기본적으로 100개의 행이 생성됩니다.

2) (column) : 각 열은 변수를 나타냅니다. 설문지 문항에 10개의 변수가 있는 경우 기본적으로 10개의 열이 생성됩니다.

3) (cell)“ 각 설문 응답자들이 응답한 변수의 값을 의미합니다.

 

 

SPSS를 이용하여 분석하기 이전에 각 변수들은 변수의 이름(변수명), 데이터의 형식, 변수의 속성, 속성 값 들이 정의될 필요가 있습니다. 변수와 관련된 이런 작업들은 메뉴 창의 데이터-> 변수특성 정의를 선택하는 방식으로 이루어질 수 있지만, 보다 직관적이고 편리한 방식으로 SPSS에서는 변수 보기탭을 별도로 제공하고 있습니다.

변수의 정의를 설명하기 위하여 다시 앞부분에서 제시되었던 설문지의 예를 들어 설명하기로 하겠습니다.

문항 1. 당신이 좋아하는 과목은 다음 중 무엇입니까?

1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다 ________

문항 3. 당신의 성별은 무엇입니까?

1) 남성 2) 여성

위와 같은 설문지에 응답한 응답자 두 사람의 응답 값을 SPSS의 데이타보기 창에 직접 입력하였다고 합시다. 응답자1은 각각 1) 수학, 89, 1) 남성을, 응답자 22) 과학, 90, 2) 여성으로 답하였습니다. 이를 데이터 보기 창에 아래와 같이 직접 입력해 봅시다. 데이타의 입력을 완료할 경우, 문항 1)을 하나의 변수로 간주하게 되며, 문항2와 문항 3 역시 각각 하나의 변수로 정의함으로써 총 3개의 변수가 생성되게 됩니다. 변수 이름은 SPSS에서 자동으로 Var00001처럼 부여하게 됩니다.

 

그러나 자동으로 부여되는 Var00001같은 변수 이름은 자신이 보다 잘 이해할 수 있는 변수 이름으로 변경하는 것이 편리하며, 아울러 향후 분석을 위해서는 변수의 특성들을 다시 정리할 필요가 있습니다. 이런 작업들은 프로그램 하단의 ‘변수보기’ 탭을 누르면 할 수 있습니다.

‘변수 보기’.

우선 첫번째 열에는 변수 이름이 있습니다. 변수 이름은 영어 알파벳과 숫자를 조합하여 직접 입력함으로써 변경할 수 있습니다. 그외 특별한 규칙은 없지만 보통 연구자가 알아보기 쉬운 규칙을 정하여 이름을 붙이게 되며, , 한글 이름은 권장되지 않습니다. 한글SPSS 버전에는 이용이 가능하지만 영문판 SPSS에서 구현이 되지 않아 향후에 데이터를 교환하거나 공유할 때 호환성 문제가 발생되기 때문입니다.

두번째 열에는 유형이 있습니다. 데이타의 유형은 크게 여러 가지가 있습니다. 유형칸에 있는 셸을 클릭하면 선택할 수 있는 여러 가지 유형이 나타나면 자기에게 적합한 유형을 선택하면 됩니다. 이중에서 가장 빈번하게 사용되는 변수의 유형은 숫자와 문자입니다.. 숫자는 데이터 보기 탭에 있는 데이터가 아라비아 숫자로 이루어져 있을 경우 선택하게 됩니다. 이때 주의하여야 할 점은 여기서 이야기하는 숫자는 사칙연산이 가능한 숫자와 더불어 특정 이름을 지목하는 단순한 기호 형태의 숫자도 포함한다는 점입니다. 일예로, 위의 설문에서 문항 2)는 평균 점수로서 계산이 가능한 명백한 숫자이지만, 문항 1)의 경우처럼 숫자 1이 단지 특정 과목을 지칭하는 기호에 불과함에도 불과하고 여기서는 숫자로 지정해야 합니다. 즉 변수 유형에서는 단순히 데이터 보기 창에서 어떤 외형적인 형태로 데이터가 입력되어 있는지만을 기준으로 합니다. 아울러 선택할 수 있는 변수 유형중에 문자는 데이터 형태가 한글이나 영문 문자인 경우에 해당됩니다. 일예로 응답자에게 ‘Kim’이나 이 원준직접 자기 이름을 쓰도록 설문 문항이 되어 있다면 이 문항의 변수는 문자로 지정해야 할 것입니다. 그외 변수 유형은 자주 사용되지 않으므로 차차 알아보도록 합시다.

셋째 열과 넷째 열은 데이터의 크기를 지정할 수 있습니다. 즉 데이타의 자릿수와 소수점 이하 자릿수를 지정합니다. 너비가 8이라는 것은 최대 8자리까지 입력이 가능하며, 소수점 이하가 2라는 것은 소수점 둘째 자리까지 허용한다는 의미입니다. 즉 이런 경우에는 99999999.99가 최대 허용값이 될 것입니다. 다만 유형이 문자인 경우에는 다소 주의가 필요합니다. 영어 알파벳 한글자는 한 자리를 차지하지만 한글은 한 글자가 두 자리를 차지합니다. 그 결과 너비가 8로 지정된 경우 영어는 ‘abcdefgh'8글자까지만 입력이 가능하고, 한글은 가나다라4글자만 입력이 가능합니다. 더 길이가 긴 문자를 입력하기 위해서는 해당 셀을 클릭해서 원하는 크기만큼 변수의 너비를 늘리거나 줄일 수 있습니다.

다음은 다섯 번째 열의 ‘설명’ 입니다. 설명은 말 그대로 변수에 대하여 상세하게 설명을 붙일 수 있습니다. 영어와 숫자로만 구성된 변수 이름만을 보고 그 변수가 어떤 변수인지 알기는 어렵습니다. 그 결과 분석자의 이해를 돕기 위하여 설명을 첨가하게 됩니다. 변수의 의미에 대하여 자유롭게 설명을 첨가할 수 있습니다.

여섯 번째 열은 변수 값입니다. 변수 값에 대한 이해를 하기 위해서는변수변수 값의 차이를 간단히 알아야 합니다. 변수는 설문의 문항이라고 생각하시면 되고 변수 값은 문항에서 선택 가능한 혹은 입력 가능한 답변이라고 생각하시면 됩니다. , 위 설문지의 예에서 성별을 물어보는 문항 3)은 하나의 변수가 되고, 문항 3)의 보기인 1. 남자, 2. 여자는 변수 값이 됩니다. 그러나 변수 값이 각각 남자나 여자와 같은 구체적인 내용을 담고 있지만 SPSS에서는 12로만 입력이 되었습니다. 향후 분석시 분석 결과가 1, 혹은 2로 표시된다면 이것이 무슨 의미인지 파악하기가 어려울 수 있습니다. 변수 값을 붙이지 않더라도 분석은 이루어지지만, 분석 결과의 이해를 편리하기 위해서 보통 변수 값을 붙이게 됩니다.

변수 값을 지정하는 방식은 간단합니다. 변수 값에 해당되는 셸을 클릭하시면 아래와 같이 대화창이 나타납니다. 여기에 변수에 해당되는 값을 입력한 후,, 추가로 변수 값에 대한 설명을 입력하고 ‘추가’‘추가’ 버튼을 누르시면 됩니다. 모든 변수 값에 대한 입력이 완료되면 확인버튼을 누르시면 됩니다.

마지막으로 일곱 번째 열의 결측 값을 설명드리겠습니다. SPSS에서 처리가능한 결측 값은 시스템상의 결측치와 응답자의 결측 값으로 구분됩니다. 시스템 결측치는 데이타가 기록될 셀이 공백인 경우로서 보통 마침표로 표시됩니다. 그러나 응답자 결측치는 해당 문항이 누락되었음을 표시하기 위하여 어떤 특정한 값을 부여한 것입니다. 보통 9 혹은 99 등의 값을 응답자 결측치로 부여하게 됩니다. 일단 여기서 9혹은 99를 결측치로 지정하게 되면 ‘‘데이터 보기’ 창에’창에 999 같은 값이 있더라도 숫자로 인식하지 않고 무응답으로 인식하여 각종 계산에서 제외되게 될 것입니다.

: 청주대학교 이 원준 (meetme77@naver.com)

 

 

728x90
728x90

1. 사례를 통한 설문지 작성 이해

외식 관련 신사업을 기획하고 있는 A기업의 김부장은 최근 신문을 보다가 아래와 같은 뉴스기사를 접하게 되었습니다. 최근 A기업에서는 기존 국내 배달 음식이 핏자나 치킨에 머물고 있는 점에 착안에서 멕시코 요리인 타코를 배달하는 신사업을 구상중입니다.

[조사문제의 사례]

미국 소비자들은 1일 평균 2.3가지에 달하는 각종 간식(snacks)을 먹고 있는 것으로 드러났다. 1일 두가지 간식을 먹는다고 응답한 이들이 41%에 달해 가장 높은 비중을 차지한 데 이어 3가지가 24%, 한가지가 17%, 4가지 13%, 5가지 이상 4% 등의 순으로 집계된 것. 그렇다면 간식이 단순한 간식을 넘어 주요한 식생활의 일부로 완전히 자리잡았음을 시사하는 수치인 셈이다. 워싱턴벨뷰에 소재한 시장조사기관 하트먼 그룹은 20129~11월 온-라인을 통해 진행한 후 3일 공개한 미국인들의 간식 실태조사결과를 통해 이 같이 밝혔다. 조사결과에 따르면 소비자들은 대부분 오후시간과 저녁 때, 늦은 밤시간에 간식을 먹고 있는 것으로 파악됐다.

이 신문 기사를 보면서 김부장은 국내 간식 시장에 대해서 실제로 자신이 알고 있는 것이 별로 없다는 것을 깨닫게 되었습니다. 이런 문제점을 깨닫고 나니 우리 회사에도 마케팅 조사라는 것을 한번 해봐야하지 않나하는 생각이 들게 되었습니다.

2. 설문지 작성 연습

자 이제 본 블로그의 이전 포스팅에서 배웠던 마케팅 설문지의 작성 과정을 이용해서 국내 간식 시장에 대한 간단한 1페이지 분량의 설문지를 작성해 보도록 하겠습니다. 다시 한번 설문지 작성 프로세스를 참조하시기 바랍니다. 여러분도 같이 생각해보시면서 더 좋은 방법들이 있는지 같이 생각해보시기 바랍니다.

<마케팅 조사 절차>

1) 마케팅 조사의 목적 결정

이번 조사를 통해서 김부장은 크게 두 가지 정보를 확인해보고 싶어합니다 첫번째 정보는 국내 소비자들이 미국 소비자들처럼 간식을 자주 먹고 있는지 궁금해 합니다. 만일 간식을 많이 먹는다면 새로운 배달 산업의 성공 가능성이 높다고 판단하기 때문입니다. 두번째 정보는 특히 A기업이 새로운 간식 아이템으로 생각하고 있는 타코가 한국 소비자들에게 어떻게 인식될지 알고 싶어 합니다. 멕시코 요리는 아직 많이 생소하기 때문에 소비자들이 혹시 거부감을 갖지는 않을까 우려되기 때문입니다.

그래서 마케팅 조사의 목적을 (1) 국내 간식 시장의 현황을 파악하고, (2) 타코에 대한 소비자 태도에 관한 정보를 수집하는 것으로로 결정하였습니다.

2) 데이타 수집방법의 결정

이제 어떤 방식으로 설문을 수행할지 결정할 시기입니다. 김부장은 전국적인 프랜차이즈 사업을 하고 싶어하기 때문에 전국민을 대상으로 설문을 진행하고 싶어합니다. 그리고 타코를 조사 현장에서 맛보기하면서 신제품 평가를 받는다면 더 좋을 것 같습니다.

그러나 결정적으로 중소기업인 A기업은 아직 이런 대규모 조사를 할 만한 재정적 여력이 없는 것이 한계입니다. 그래서 많은 돈이 드는 면접원을 이용한 대규모 설문조사를 포기하였습니다. 대신 저렴한 비용으로 많은 응답자들로부터 설문을 받을 수 있는 온라인 조사를 시행하기로 하였습니다. 이런 의사결정에는 타코 신제품 출시가 고작 2개월이 채 안남았기 때문에 결과를 빨리 받아야하는 현실적인 이유도 일부 반영되었습니다.

3) 설문 항목 및 내용의 구성

먼저 설문의 맨 첫페이지에 간략하게 설문의 의도와 개인정보 보호를 보장하는 조사 소개문을 간략히 작성한 다음에, 어떤 문항을 물어봐야 할지 여러가지 고민을 하고 있습니다.

먼저 국내 간식 시장의 현황에 대한 문항들로, a. 간식을 자주 먹는지, b. 주로 선택하는 메뉴는 무엇인지, c. 그리고 간식을 먹는 시간은 언제인지를 확인하고자 합니다.

또한 타코 신제품에 대한 평가를 위하여, a. 타코가 무엇인지 아는지, b. 타코를 먹고싶은지, c. 타코의 가격은 얼마가 적정한지, d. 그리고 타코하면 떠오르는 이미지들 에 관하여 확인하고자 합니다.

그리고 마지막으로 응답자의 a. 성별, b. 연령, c. 직업에 관한 개인 정보를 습득하여 마케팅에 활용하기로 하였습니다.

4) 내용 결정 및 척도의 결정

자 이제 이런 문항들을 어떻게 구체적으로 물어볼지 정리하고, 이어서 척도는 어떤 척도를 사용할지 고민할 차례입니다.

먼저 조사 소개문을 다음과 같이 작성해 봅니다.

안녕하십니까? 본 조사는 국내 간식 시장에 대한 마케팅 조사의 일환으로 기획되었습니다. 본 조사에 대한 귀하의 고견은 연구 목적에만 사용되며, 다른 용도로 활용되지 않을 것입니다. 연구에 협조해 주셔서 감사합니다

A 기업 조사담당담 김00 (전화: 031-700-5000)

보다 자세히 조사 목적을 설명할 수도 있지만, 간식 소비 전반에 관한 문항들도 포함되어 있어서 타코만을 위한 조사라고 하기에는 적절치 않은 것 같아서 이정도면 그냥 만족스러워 보입니다. 그리고 설문 내용에 대한 문의를 받기 위한 연락처도 삽입하였습니다.

다음은 간식 소비 현황에 대한 질문들을 간략하게 작성해 보았습니다. 간식을 먹는 정도를 물어볼 때 어떤 척도를 쓰는 것이 적절할지 고민이 됩니다. 리커트 척도형을 쓸 수도 있고 명목척도로 물어볼 수도 있지만, 일단 향후 분석을 위해서 리커트로 물어보기로 합니다. 간식의 종류는 거의 많이 알려져 있으므로 보기를 제시하는 형태로 가면 될 것 같습니다. 그리고 간식을 먹는 시간은 직접 시간을 쓰게 할 수도 있지만 응답자가 번거로울것 같아서 시간대를 보기로 주고 물어보기로 합니다. 그리고 가능하면 존댓말을 사용하여 응답자가 보다 존중받는다는 느낌이 들도록 하였습니다.

그런데 설문을 만들고 보니, 이렇게 문항을 만들면 몇가지 문제들이 생길 것 같습니다.

우선 첫번째 Q1 문항의 문제로, 사람들, 특히 몸무게에 민감한 여성들이 솔직하게 대답을 해줄까 하는 생각이 듭니다. 그리고 Q2 문항의 문제로서 혹시 연구자가 미처 생각하지 못한 간식 메뉴들이 있지 않을까 하는 우려가 됩니다. 포항에서는 과메기를 먹는다던데, 이런 응답자들에 대한 걱정이 살짝 듭니다. 그리고 Q3를 보니 정확하게 간식을 오후 18시에 먹는 사람은 3번과 4번 모두 선택할 수가 있습니다.

이런 문제점들을 보완하기 위해서 다시 설문지의 워딩을 다듬습니다. 우선 귀하라는 표현을 귀하는 다른 사람들이로 바꾸엇습니다. 이렇게 다른 사람의 경험으로 투영해서 물어보더라도 응답자는 실제로는 자신의 경험을 기준으로 답을 하기 때문에 보다 솔직한 답을 얻을 수 있을 것 같기 때문입니다. 그리고 다른 문제가 되는 부분들도 모두 보완을 합니다.

자 이제 비슷한 과정을 거쳐서 타코에 관한 소비자 태도 문항과 인구통계적 정보에 관한 문항들을 다음과 같이 완성하였습니다. 다만 여기서는 보다 개인의 의견을 알고 싶기 때문에 타인의 의견으로 투영하지 않고 직접적으로 물어보기로 하였습니다.

크게 별다른 사항은 없지만, Q4타코에 대한 이미지는 아직 응답자들에게 생소하기 때문에 그냥 떠오르는 내용들을 자유롭게 적도록 하는 것이 좋을 것 같아 주관식 문항으로 작성하였습니다. 그리고 Q7 문항의 보기 2)의 경우 학생들을 초, , , 대학생으로 더욱 세분하여 보는 것이 더 필요하지만, Q6 문항에서 이미 나이를 물어봤기 때문에 나중에 Q6Q7 문항을 같이 결합하여 분석하면 충분히 원하는 정보를 얻을 수 있을 것 같아 일부 보기를 생략하고 간략하게 제시하였습니다.

5) 질문 순서의 결정

자 이제 어떤 순서로 질문들을 배치할까 고민해야 합니다. 우선 별 고민없이 조사의 목적과 내용을 간략히 소개하는 조사소개문을 가장 처음에 배치하기로 합니다그리고 그 다음에 간식에 대한 설문 문항이 좋을지, 타코에 대한 태도 문항이 좋을지 고민이 됩니다. 대답하기 쉽고, 친근한 문항을 먼저 놓아야 한다는 관점에서 간식에 대한 설문을 먼저 물어보고난 후 타코에 관한 태도를 물어보기로 합니다. 그리고 가장 민감한 개인 정보들은 설문의 마지막에 물어볼 것입니다.

6) 설문의 편집 및 완성

이제 어느정도 설문지의 질문 내용과 구성이 완료되었으므로 오탈자가 없는지, 문맥이 이상한지,이해하기 힘든 단어나 문장은 없는지 검토해보기로 합니다. 검토해보니 나이가 많은 계층들이 타코가 무엇일지 알까 걱정이 됩니다. 그래서 타코에 대한 간략한 설명을 설문지에 달아주기로 합니다. 다행히 그외 잘못된 부분들은 보이지 않는군요.

이제 설문 문항을 보기좋게 레이 아웃을 잡고 편집만 하면 설문지는 완성입니다. 본 설문지는 온라인 조사로 진행되므로, 편집 관련 작업은 온라인 설문지를 만드는 과정에서 다시 상세히 보기로 합시다.

3. 구글을 이용한 온라인 설문작성

최근 온라인을 통한 인터넷 조사들이 활성화되면서, 무료 혹은 저렴한 비용으로 온라인 마케팅 조사를 지원하는 다양한 사이트들이 등장하고 있습니다해외의 대표적인 사이트로는 서베이 몽키(http://ko.surveymonkey.com/), 구글 등이 있으며, 국내에도 두잇(http://www.dooit.co.kr/) 등 여러 사이트가 등장하여 활용되고 있습니다. 또한 스마트폰 등 모바일을 이용한 온라인 조사 도구들도 다수 등장하고 있는 상황입니다.

오늘은 이 중에서도 가장 많은 사용자를 가지고 있으며, 다른 사이트들보다 자유롭게 설문 구성이 가능한 구글, 보다 정확히 말하면 구글 독스(Google Docs)를 중심으로 설문지 작성 방법을 설명드리도록 하겠습니다. 구글 독스는 무료로 마케팅조사가 가능하며, 이메일 등 다른 구글 서비스와 연계가 편리합니다. 또한 설문 받은 데이타를 실시간으로 구글 스프레드나 엑셀 파일로 이용이 가능하며, 배우기 쉬운 장점이 있어 많은 이용자를 확보하고 있는 서비스입니다.

(1) 구글 독스 로그인하기

구글 독스를 이용하여서 설문지를 작성하기 위해서는 먼저 http://drive.google.com 사이트를 방문하신 후, 구글 계정으로 로그인을 하셔야 합니다. 계정이 없는 경우에는 새로 하나를 만들어야 합니다.

(2) 양식 만들기 시작하기

로그인을 한후에는 구글 드라이브의 초기 화면이 나타납니다. 초기 화면에는 이미 내가 만든 구글 설문지나 문서들이 보여지지만, 처음 로그인한 경우에는 아무 것도 화면상에 보여지지 않을 것입니다.

다음으로 화면 왼쪽의 만들기 버튼을 클릭하신후, 양식을 선택하시면 바로 구글 설문 작성을 시작할 수 있습니다.

(3) 화면 및 메뉴의 설명

1) 항목추가 버튼 :  설문지의 문항을 추가하거나, 문항의 중간에 분할선을 추가할 때 사용하는 버튼입니다.

2) 설문 제목 입력 : 설문의 큰 제목을 표시하는 부분입니다. 여기에 쓰는 제목은 응답자에게도 동일하게 보여지므로, 조사의 목적을 간결히 잘 나타내는 제목을 선택합니다.

3) 제목 부가설명 입력 :  연구의 목적이나 주제, 기타 응답자에게 고지해야 할 사항들을 적을 수 있으며, 보통 조사소개문을 입력하기에 가장 적합한 공간입니다.

4) 질문 제목 :  설문 문항의 구체적인 질문 내용을 적어 넣을 수 있습니다. 입력이 완료한 이후, 다음 설문 문항을 입력하기 위해서는 1) 항목 추가 버튼을 누른후 같은 과정을 반복하면 됩니다.

5) 도움말 텍스트 :  설문 문항에 대하여 추가적으로 도움말이 필요한 경우 선택적으로 사용할 수 있습니다.

6) 질문 유형 :  설문의 응답 형태를 어떤 형태로 받을지 양식을 결정할 수 있으며, 설문의 척도 유형을 선택하는 메뉴라고 이해하시면 됩니다. 여기서 선택가능한 답변의 유형은 크게 5가지입니다.

- 텍스트: 한줄 정도의 간략한 텍스트를 주관식으로 입력받아야 할 경우이며, 이름, 나이, 학번 등의 정보 입력에 활용됩니다.

- 단락 텍스트 : 비교적 긴 문장의 데이타를 입력받을 때 선택하며, 응답자의 의견을 구하거나, 주소를 입력받을 경우 등에 활용됩니다.

- 선택형 질문 : 여러개의 보기 문항중 하나를 선택할 때 사용합니다. 일예로, 자신의 성별을 고르거나 보기중 가장 마음에 드는 것을 고르게 할 때 사용가능합니다.

- 확인란 : 여러개의 보기 문항중 하나 이상의 보기를 복수로 선택할 때 사용할 수 있습니다. 일예로 지금까지 먹어본 중국음식을 모두 고르라고 할 때 사용할 수 있을 것입니다.

- 목록에서 선택 : 기본적으로 선택형 질문과 비슷하지만, 보기가 번호로 주어집니다.

- 점수범위 선택 : 각 번호에 대한 설명을 별도로 달 수 있도록 구성되어 있습니다. 3점 척도에서 10점 척도까지 자유롭게 작성할 수 있으며, 하나의 척도 문항을 구성할 때 사용할 수 있습니다.

- 그리드: 점수범위 선택과 마찬가지로 리커트나 의미차별화 척도 등을 구성할 때 유용하게 사용할 수 있으며, 여러개의 척도를 동시에 작성할 수 있습니다. 그러나 현재는 5점 척도만으로 본 기능의 이용이 가능합니다.

7) 답변: 선택한 질문 유형에 따라 적합한 답변 유형이 자동으로 나타납니다.

8) 완료 버튼 : 한 개의 설문 문항 작성이 완료된 이후에는 완료 버튼을 눌러야만 다음 문항의 작성을 할 수 있습니다. 만일 반드시 응답v표를 하게 되며는, 설문 응답자가 해당 문항에 응답을 하지 않으면 다음 문항으로 넘어가지 못하도록 강제할 수 있습니다.

9) 문항 메뉴 버튼 :  작성한 설문 문항을 수정하거나 삭제할 수 있습니다.

10) 설문의 URL 주소 :  작성한 설문 문항의 웹 주소가 표시되며, 이 링크를 클릭할 경우 언제든지 설문에 참여할 수 있습니다. 설문 작성을 완료한 이후, 응답자에게 이 링크를 이메일이나 문자 메시지로 보냄으로서 온라인 설문에 참여할 수 있습니다.

11) 공유 : 구글 플러스에서 이 설문 양식을 공유할 수 있으며, 다른 연구자와의 공동 작업이 가능합니다.

12) 이메일로 양식 보내기 :  설문지를 만든 후 응답자들에게 이메일로 설문 문항을 바로 보낼 수 있습니다. 각각의 이메일 주소를 쉼표로 구분하여 입력시 동시에 여러명에게 보내는 것도 가능합니다.

13) 응답보기 : 설문 결과를 그래프 등의 요약 형식이나 엑셀 형식으로 볼 수 있습니다.

14) 추가작업 :  임베디드와 응답 완료후 자동으로 보여주는 확인 메시지를 원하는 문구로 수정할 수 있습니다.

15) 저장 : 작성 중 저장 버튼을 누르면 지금까지 작성된 내용이 저장됩니다.

(4) 설문조사 URL 보내기

설문의 작성이 완료된 경우에는 화면 하단의 URL을 복사해서 이메일이나 문자, 혹은 게시판 게시 등을 통해서 응답자들에게 전송해야 합니다. 응답자들은 보내진 URL 링크를 클릭함으로서 온라인 설문조사에 참여할 수 있습니다.

주소는 보통 https://docs.google.com/spreadsheet/gform?key=0As9r1UBQAFaNdGFoa2JsbEp6aVdPTjZRRWF0RVJSaUE&gridId=0#edit 처럼 매우 길게 나타나기 때문에 사용에 불편할 수 있습니다이 문제를 해결하기 위하여 URL을 단축시켜주는 무료 서비스들을 이용할 수 있습니다. https://bitly.com/, 혹은 http://durl.kr/ 등의 사이트를 방문해 보시기 바랍니다. 매우 긴 주소를 http://durl.kr/4a4smn처럼 짧은 주소로 변환할 수 있습니다.

(5) 데이타 파일 받기

설문 조사 결과는 설문 완료후에는 물론이고 설문 진행중에도 언제라도 데이타 파일로 확인할 수 있습니다. 조사 결과는 엑셀과 유사한 스프레드 쉬트 형식으로 제공되며, 엑셀이나 TXT 등 조사자가 필요로 하는 형태로 파일을 저장할 수도 있습니다. 조사가 완료된 데이타는 엑셀로 저장한 후 SPSS에서 엑셀 파일을 읽어들임으로서 통계 분석에 바로 활용할 수 있습니다.

4. 구글 설문지 작성 연습

이제 구글을 이용한 설문 작성 방법에 대하여 이해하셨으리라 생각합니다. 본 차시의 앞부분에서 작성하였던 A기업의 설문지를 대상으로 직접 같이 온라인 설문지를 완성해 보도록 하겠습니다.

(1) 조사소개문의 작성 : 구글에 로그인 한 후, 양식을 새로 만들어 봅니다. 설문지의 제목을 입력한 후에, 조사소개문을 부가설명 입력란에 차례에 입력을 합니다.

(2) 간식 시장 현항에 관한 문항 작성 : 우선 간식의 소비 현황에 관한 3개의 문항들을 작성해 보도록 하겠습니다. 첫번째 문항은 7점 척도 문항이므로 점수범위 선택을 이용하여 7점 척도로 구성하고, 양극인 1점과 7점에는 라벨을 달아 줍니다. 그리고 반드시 응답해야 하는 질문으로 설정합니다.

다음 두개의 문항은 보기중 하나를 선택해야하는 질문이므로 질문 유형중 선택형 질문을 선택한 후 설문을 작성합니다.

(3) 타코에 대한 태도 : 다음으로 타코에 대한 태도를 조사하기 위하여 4개의 설문 문항들을 작성하겠습니다. 타코에 대한 인지도는 선택형 질문을 선택하여 문항을 작성합니다. 그리고, 타코를 먹고 싶은 의도는 점수범위 선택을 이용하여 7점 척도로 구성하고, 타코의 가격은 텍스트’, 타코의 연상에 관한 문항은 단락 텍스트로 항목을 추가하여 차례로 작성합니다.

(4) 인구통계 배경 질문 : 마지막으로 성별, 연령, 직업을 확인하는 질문들을 통일한 방식으로 작성하시면 온라인 설문지가 완성됩니다.

(5) URL 복사해서 보내기

이제 온라인 설문의 마지막 단계입니다. 화면 하단에 표시된 URL 주소를 복사하셔서 설문 응답대상자에게 이메일이나 문자 메시지로 보내시면 온라인 설문 조사가 시작됩니다https://docs.google.com/spreadsheet/viewform?formkey=dFhRMzljeno2YU1fbl9fUk1vU0pOYkE6MQ 이 너무 길다면, URL 단축 서비스를 이용하셔서 http://durl.kr/4a59hd 처럼 짧게 만들어 보내시면 더욱 편리할 것입니다.

: 청주대학교 이 원준 (meetme77@naver.com)

728x90
728x90

1. 설문지 작성의 중요성

마케팅 종사자를 포함한 대부분의 사람들에게 마케팅 조사란 곧 설문지 조사를 연상할 만큼 마케팅조사에서 설문지가 차지하는 부분은 큽니다. 연구조사 과정에서 설문지는 1차 데이타를 수집할 수 있는 가장 보편적인 방법이며, 연구자의 연구 목적을 그대로 담고 있는 중요한 수단입니다. 따라서 연구 목적을 잘 반영하고 있는 좋은 설문지는 성공적인 마케팅 조사의 필수적인 요건이 되지만, 많은 연구들은 설문지 작성의 오류로 연구 목적을 달성하지 못하는 경우도 빈번합니다. 설문 조사에는 오랜 시간과 적지 않은 비용이 수반되므로 조사를 변경하거나 재조사를 시행할 여유가 없는 것이 대부분입니다. 따라서 단 한번의 실수도 큰 타격이 될 수 있습니다. 이런 위험을 방지하기 위해서는 설문지 작성 전단계부터 치밀한 계획과 준비가 있어야 할 것입니다.

2. 설문지의 내용

설문지를 이용한 조사를 진행할 때는 무엇보다도 조사에 사용될 설문지의 표준화가 중요합니다. 표준화된 설문지란 동일한 질문, 동일한 양식을 사용한 설문지로서 어떤 면접원이 이용하더라도 동일한 내용을 담고 있어야 함을 의미합니다. 대규모의 상업적 마케팅 조사에는 수십명의 면접원이 동원되며, 지난 2010, 10년만에 중국에서 인구 총조사를 하였을 때는 동원된 면접원만 600만명이었다고 합니다. 만일 각각의 면접원들이 각기 다른 설문지를 사용하였다면 어렵게 얻어진 자료의 일관성이 떨어져 데이타로서의 가치가 없어질 것입니다. 또한 표준화된 설문지를 사용할 경우 면접원 교육에 소요되는 시간을 절감할 수 있고 자료의 분석이 용이해지는 등 다양한 장점이 있습니다.

설문지는 조사 기관이나 연구 목적에 따라 다소 차이는 있지만 크게는 다음과 같은 6가지의 항목으로 구성되어 있습니다. 반드시 6가지 항목이 모두 사용되어야 하는 것은 아니며, 일부 항목은 필요에 따라 포함되거나 제외될 수도 있습니다.

1) 조사 소개문 : 응답자에게 협조를 요청하는 내용으로서 보통 설문지의 첫페이지에 삽입합니다. 응답자에게 조사자의 소속이나 소개, 조사의 목적, 개인정보와 응답 내용에 대한 비밀 보장들을 약속함으로서 조사의 참여율을 높여주고, 응답자의 협조를 이끌어냅니다. 응답자가 직접 구두로 이런 내용을 고지하기도 하지만, 대부분의 경우 단순히 설문지에 인쇄한 내용으로 조사 소개문을 대체하기도 합니다.

2) 식별 자료 : 이는 각 설문지를 구분하기 위한 식별 번호와 추후 확인 조사를 위하여 응답자의 이름, 주소, 전화번호 등 연락처를 포함합니다. 아울러 조사를 실시한 면접자의 이름과 면접 일시를 기록하여 추후에 성실하게 조사가 이루어졌는지 검증하는 목적으로 사용되는 자료이다.

3) 지시문 : 설문 응답을 손쉽게 받으려면 응답자 스스로 설문에 응답할 수 있도록 상세하게 설문지 응답 방식을 알려 줄 필요가 있습니다. 보통 응답 방법이나 응답 순서, 특정 문항의 응답시 주의 사항 등에 관한 내용을 알려주게 됩니다.

4) 본 문항 : 설문지의 내용중 가장 중요한 부분으로서, 설문 조사를 통하여 알고자 하는 내용들이 문항으로 적절히 제시되어야 합니다. 본 문항의 작성 방법에 대해서는 본 차시의 후반부에 다시 상세히 설명될 것이다.

5) 배경 문항 : 흔히 데모(demo) 혹은 인구통계학적 정보라고 일컫는 문항들로서 응답자의 연령, 성별, 결혼 유무, 직장, 소득 등 개인적 특성과 관련된 문항들입니다. 본 문항에서 얻은 조사 결과들은 응답자 특성별로 분류하고, 시장 세분화 등 전략 개발을 하기 위하여 반드시 필요한 문항들입니다. 그러나 개인의 사생활을 침해할 수 있는 정보이므로 응답자들도 쉽게 정보를 주기를 꺼리며, 개인의 인격을 침해할 소지도 있습니다. 이런 문제점들을 해결하기 위해서 배경 문항은 반드시 필요한 문항 위주로 최소화하여 불필요한 정보를 수집해서는 안될 것입니다. 또한, 설문지의 마지막 부분에 물어보는 방식등을 통하여 응답자가 설문 자체를 거부하는 일이 없도록 해야 합니다.

6) 기타 보조 도구 : 그 밖에 경우에 따라서 사진이나 상품 카타로그 등 보조적 자료를 가지고 다녀야 할 필요가 있습니다. 일예로 신상품에 대한 소비자의 평가를 알고자 할 때 신상품 실물, 혹은 컨셉 카드를 별도로 가지고와 보여주면서 설문을 받기도 합니다.

3. 설문지 작성 과정

설문지를 작성하는 순서에 관하여 정해진 법칙이 있는 것은 아니며, 보통 오랜 경험과 시행착오를 거치면서 자기만의 노하우를 쌓아가게 됩니다. 그러나 작성 과정에 대한 고민없이 생각나는데로 설문지를 만들어 간다면 연구자가 의도한 데이타를 얻기는 매우 어려울 것입니다. 설문지 작성 과정에 나타나는 공통적인 단계들을 살펴보면 보통 연구의 목적을 먼저 확정하고나서 데이타 수집 방법, 설문 항목의 내용, 질문 순서 등을 차례로 결정하게 됩니다.

1) 마케팅 조사 목적의 결정

마케팅 조사는 조사를 통하여 자신이 확인하고 싶은 것이 무엇인지 인식하는 것에서 출발합니다. , 연구자 자신이 현재 가지고 있는 문제는 무엇이며, 이 문제를 해결하거나 더 나은 의사 결정을 하기 위해서는 어떤 데이타들이 필요할 것인지를 사전에 알고 있어야 합니다. 일 예로, 패션 상품을 만드는 상품 기획자는 내년도에 유행할 색상이나 스타일을 확인하고 싶어하며, 이를 위해서는 유행을 선도하는 고객층으로부터 의견을 물어봐야 한다는 사실을 알고 있습니다. 스마트폰 개발자는 내년도에는 더 큰 사이즈의 액정 화면이 인기일 것이라고 판단하고는 있지만, 이를 상품화하기 위해서는 조금 더 확실한 증거가 필요하다고 느낄 수 있습니다. 이처럼 연구를 시작하기 이전에 이미 연구자가 마음 속에서 확인해보고 싶은 사실들을 보통 가설(Hypothesis)이라고 부릅니다. 따라서 설문지 작성에 앞서 조사자가 가장 먼저 결정해야 하는 것은 설문 조사를 통하여 자신의 가설이나 생각을 검증하는데 어떤 정보들이 필요할 것인가를 결정하는 것입니다.

2) 데이타 수집 방법의 결정

두번째 단계는 어떤 방식으로 데이타를 수집할 지 결정하는 것입니다. 데이타의 수집 방법으로는 직접 면접원이 설문 응답자를 찾아가야 하는 면접법, 전화에 의한 조사, 우편물 조사, 인터넷 조사 등 다양한 방법이 있는데, 이중 어떤 방법을 선택하느냐에 따라서 조사의 내용이나 설문 문항의 수, 조사 기법 들이 달라지기 때문입니다 예를 들어 전화로 설문을 하는 경우에는 설문 문항이 길다면 응답자가 중도에 전화를 끊어버릴 가능성이 크기 때문에 문항이 간결해야 합니다. 또한 시각적 자료를 사용할 수 없으므로 소비자가 잘 알지 못하는 신상품에 관하여 설명하기가 어려울 수 있습니다. 반면에 면접법은 응답자가 긴 설문에도 성실히 응답할 가능성이 크며, 면접원이 응답자의 질의에 답하거나 추가적인 정보를 주는 것이 가능하므로 난이도가 높은 설문 조사를 실시하기에 적합합니다. 주요 수집 방법들을 간략히 살펴보면 다음과 같습니다.

  () 대인면접법 : 면접원이 직접 응답자가 위치한 장소를 방문하거나 응답자를 일정한 장소에 모이도록 한 다음 1:1로 설문을 받는 방법입니다. 보통 대인면접을 할 경우 비교적 오랜 시간동안 설문조사를 할 수 있으며, 다소 어려운 질문을 받기도 용이합니다그러나 단점으로는 비교적 많은 비용과 시간이 소요되며, 면접원의 기분이나 외모 등의 통제할 수 없는 요건들이 응답자의 응답에 영향을 미칠 수 있습니다. 실제로 면접원이 뛰어난 미인일 경우 응답자들이 자신의 실제 소득이나 학력 등을 과장되게 적는 사례들이 발견되기도 하였습니다.

  () 전화 조사 : 전화 조사는 전화번호부 등을 활용할 경우 응답자 리스트를 작성하기 쉬우며, 시간과 비용이 적게드는 장점이 있습니다단점으로는 기본적으로 상대방이 전화통화가 가능한 상황에서만 가능하지만, 최근 휴대폰 보급율이 거의 100%에 육박함에 따라 이런 문제는 크게 부각되지 않습니다. 그보다 큰 문제는 많은 응답자들이 전화상으로 10분 이상 응답하기를 꺼려한다는 점과 전화 조사를 사칭한 불법 판매나 스팸이 기승을 부르고 있다는 점입니다. 그 결과 전화 조사에 대한 일반 응답자의 응답률은 점차 떨어지는 편이며, 비교적 단순한 문항들을 중심으로 설문 문항을 구성해야 합니다. 이를 보완하기 위하여 최근에는 ARS나 컴퓨터 등 시스템을 이용한 자동 설문응답조사가 이루어지기도 합니다.

  () 우편물 조사 : 우편물 조사는 응답률이 매우 낮으며, 회신을 하더라도 설문지가 오가는 시간이 너무 오래 걸리는 단점 때문에 국내에서는 잘 사용되지 않습니다. 그러나 저렴한 비용의 장점과 더불어 응답자가 충분히 심사숙고한 후에 설문에 응답할 수 있다는 장점을 가지고 있습니다. 이런 장점 때문에 우편물 조사는 최근 전문가를 대상으로한 의견 조사 등에 사용되는 사례가 늘고 있습니다.

  () 인터넷 조사 : 최근 가장 빠르게 활용 빈도가 증가하고 있는 방법은 인터네 조사입니다. 인터넷 조사는 매우 저렴한 비용으로 신속하게 진행될 수 있으며, 사진, 동영상, 텍스트 등 다양한 보조 자료들을 활용하여 설문조사를 입체적으로 진행할 수 있는 차별적 장점을 가지고 있습니다. 또한 설문 조사시 자동으로 설문 결과가 데이타 파일로 저장되기 때문에 설문지 완료후 펀칭이나 코딩과 같은 번거로운 과정을 생략할 수 있습니다그러나 이런 장점에도 불구하고, 인터넷의 익명성은 인터넷 조사의 신뢰성에 부정적인 영향을 주고 있습니다.

3) 설문 항목의 내용 및 구성 결정

조사 목적과 필요한 정보들이 어느정도 확정이 되고나면 이 정보들을 얻기 위한 개별적인 설문 항목들이 개발되어야 합니다. 완성도 있는 설문 항목을 개발하기 위해서는 설문의 내용은 물론이고 문항에 사용되는 단어가 적절한지, 문항이 여러가지 의미로 다르게 해석될 가능성은 없는지, 혹시 응답자들에게 지나치게 민감한 질문들은 아닌지, 꼭 필요한 문항들인지 등을 살펴보아야 합니다.

일예로, “당신이 일년간 내는 세금은 얼마입니까?”라는 문항이 있다고 합시다. 이 문항은 여러가지 이유에서 설문 문항으로 적절하지 않을 수 있습니다. 우선, 응답자들이 얼마나 많은 세금을 내고 있는지 정확한 정보를 가지고 있지 않을 가능성이 있습니다. 그리고, 설사 자신의 납세 정보를 알고 있더라도 질문에서 물어보는 세금이 모든 세금의 합계를 이야기하는지 근로소득세만을 이야기하는지 명확하지 않습니다. 또한 일부 응답자들에게는 대답하기 너무 민감한 질문이어서 대답을 회피할 수도 있습니다.

설문 문항을 구성할 때는 각 문항별로 응답의 형태를 결정해야 합니다. 즉 응답자들이 설문 문항을 읽은 뒤 객관식 보기에서 답을 선택하도록 할 것 인지 혹은 자유롭게 주관식으로 답을 적도록 할 것인지를 결정하여야 합니다. 응답의 형태는 얻어지는 자료의 내용을 결정할 뿐만 아니라 특히 나중에 사용해야 하는 통계 분석 방법의 종류에도 영향을 미치기 때문에 신중하게 결정되어야 합니다.

일반적으로 응답의 형태로는 크게 주관식 응답, 선택형 객관식 응답, 리커트척도형 응답이 있습니다.

  () 주관식 응답 : 이는 응답자가 자유롭게 자신이 생각하는 내용을 표현할 수 있는 질문 방식입니다. 그 예를 살펴보면 다음과 같은 형식이 될 것입니다.

Q: 최근 학교내 폭력이 증가하는 원인은 무엇이라고 생각하십니까? 생각나는데로 그 원인을 적어 주시기 바랍니다.

    (                         )

주관식 응답의 장점으로는응답자가 제약없이 자유롭게 자기의 의견을 표현할 수 있으므로, 응답자가 존중받는다는 느낌을 받을 수 있습니다. 또한 조사자가 잘 모르거나 미처 생각하지 못했던 의견을 받을 수 있으므로, 독특한 아이디어나 의견을 수렴하는 탐색적 조사를 진행할 때 유용합니다.

그러나 단점으로는 우선 응답자가 쉽게 답을 하기 어려우며, 설문 조사에 소요되는 시간이 많습니다. 또한 설문 조사가 종료된 후 SPSS의 데이타 형태로 코딩이나 펀칭 등 자료 처리를 하는 것이 어려우며, 이 과정에서 연구자의 주관적 판단이 과다 개입될 가능성이 있습니다.

  () 객관식 응답 : 주관식 응답과는 다르게 응답자가 선택할 수 있는 응답 내용을 보기로 제시함으로서, 선택 내용을 제한하는 방식입니다. 객관식 응답에서는 앞서 제시한 예시 질문이 다음과 같은 형태로 제시될 것입니다.

Q: 최근 학교내 폭력이 증가하는 원인은 무엇이라고 생각하십니까? 보기중 직접 하나만 선택해주시기 바랍니다.

(1) 과열된 입시 (2) TV의 영향 (3) 게임의 영화 (4) 가정 불화의 증가

객관식 응답의 장점으로는 코딩과 펀칭과 같은 데이타 처리가 매우 수월하다는 점입니다. 사실상 객관식 문항의 경우 기본적인 코딩 작업이 이미 완료되어 있는 형태이고, 펀칭도 숫자만 입력하면 되므로 매우 간편합니다. 또한 응답자들에게 적절한 보기를 제기한 경우 가능한 응답을 알려줌으로써 응답상 오류를 최소화할 수 있습니다.

단점으로는, 설문지를 개발하고 완성하는데 많은 시간이 소요된다는 점입니다. 특히 응답자들이 선택할 수 있는 보기 문항을 개발하기 위하여 관련 주제에 대한 깊은 이해와 폭넓은 지식이 필요합니다. 만일 그렇치못하다면 응답자가 생각하는 내용을 설문 문항에 충실히 반영할 수 없으며, 응답자는 선택할 수 있는 보기가 없는 경우가 발생할 수 있습니다. 이런 단점을 보완하기 위하여 객관식 응답은 반드시 포괄적이고 보기 문항간에 중복이 없도록 상호 배타적이어야 합니다.

  () 연속 척도형 응답 : 연속 척도형 질문에서는 응답자들에게 자신이 질문에 내용에 대하여 평가하는 정도를 척도상에서 제시된 각 점들에 체크하도록 하는 방식이다. 연속형 척도는 보통 다음과 같은 형태로 제시될 것입니다.

이 방식의 가장 큰 장점으로는, 등간 척도를 사용함으로서, 설문을 통해 얻은 데이타는 사칙 연산이 적용되며, 평균, 분산 등 다양한 통계치를 구할 수 있다는 점입니다. 또한 응답자들이 비교적 빠르게 이해하고 응답할 수 있어서 많은 수의 문항을 질문할 때 유용한 편입니다.

단점으로는, 다수의 연속형 척도가 연속적으로 제시될 경우, 설문지가 지루하게 느껴질 가능성이 있고, 설문의 내용을 읽지않고 거짓으로 대충 응답하는 사례가 증가할 수 있다는 점입다. 아울러, 설문 문항의 개발에 적지않은 시간이 걸립니다.

대표적인 연속형 척도로는 리커트 척도의미 차별화 척도등이 있는데, 이런 척도들을 사용한 경우에는 반드시 몇개의 응답 점들을 제시할 것인가를 결정하여야 합니다. 만일 응답자가 선택할 수 있는 응답점이 5개인 경우 5점 척도, 7개인 경우는 7점 척도라고 하는데, 5점과 7점이 가장 빈번하게 쓰이는 연속형 척도입니다. 그리고 간혹적으로 4점이나 6점 척도가 쓰이기도 합다.

이때 응답 점의 갯수가 몇개인지보다는 응답점의 객수가 홀수인지 짝수인지가 더 중요한데, 홀수인 경우는 보통인 중립점이 제시되어 찬성-보통-반대가 되지만, 짝수인 경우는 중립점이 없으므로 찬성, 반대 혹은 만족, 불만족과 같은 양자 택일 형태가 되기 때문입니다.

 4) 개별적 항목의 완성

설문지에 포함될 질문 내용과 구성 방식이 결정된 이후에는 보다 구체적으로 각 질문 항목을 세부적으로 완성하여야 합니다. 같은 내용의 질문이라도 설문 문항에서 다르고 다른 경우가 많기 때문에 질문에 사용되는 어휘의 선정이나 질문의 뉘앙스 등을 세밀하게 검토하는 워딩(wording) 작업에도 신경을 써야 합니다. 실제 이런 작은 차이가 설문의 응답율은 물론이고 데이타의 품질에도 적지않은 영향을 끼치게 되기 때문입니다여기서는 설문지 작성의 실제에서 가장 빈번하게 발생하는 실수의 유형들을 살펴봄으로서 설문의 완성도를 높일 수 있는 방법을 찾아보고자 합니다.

  () 사용되는 단어는 단순하고 쉬울 것 : 조사자들이 범하는 실수중 가장 큰 것은 응답 대상자들의 수준을 고려하지 않고, 조사연구자와 비슷한 정도의 지식이나 관심을 가지고 있을 것이라고 생각하는 일입니다. 보통 조사연구자들은 오랫동안 기업이나 대학 등 유사한 집단에서 생활한 결과, 해당 집단에서 일상적으로 사용되는 용어들을 일반인들도 역시 같은 수준에서 이해할 것이라고 생각하고 때로는 전문 용어들을 사용하는 경우가 있습니다. 일예로 다음과 같은 문항을 살펴봅시다. 스마트폰 관련 산업에 종사하거나 관심을 가지고 있던 응답자들은 쉽게 대답할 수 있지만, 일반 대다수의 응답자, 특히 40대 이후의 응답자들은 이 질문의 의미를 이해할 수 없을 것입니다.

Q: 지금 사용하고 계신 스마트폰의 버전은 무엇입니까?

(1) 젤리빈 (2) 아이스크림 샌드위치 (3) 진저 브래드 (4) 기타

설문에는 누구나 이해할 수 있는 최대한 평이하고 쉬운 단어를 사용하여야 합니다.

  () 객관식 응답에서는 보기가 중복되지 않을 것 : 객관식 문항의 개발 과정은 매우 까다로운 편입니다. 보기 문항의 중복이 발생되지 않도록 해야합니다. 만일 아래와 같이 보기를 제시하면 TV 역시 미디어의 일종이기 때문에 중복의 문제가 제기될 수 있으며, 응답자들은 혼란스러워 할 수 있습니다.

Q: 최근 학교내 폭력이 증가하는 원인은 무엇이라고 생각하십니까? 보기중 직접 하나만 선택해주시기 바랍니다.

(1) 과열된 입시 (2) TV의 영향 (3) 미디어의 영향 (4) 가정 불화의 증가

() 보기가 충분히 포괄적일 것 : 보기는 포괄적이어야 합니다. 즉 대다수의 응답자들이 생각할 수 있는 보기 예시를 제시해야만 합니다. 아래의 예를 보면 학교내 폭력의 원인을 제시하는 보기로는 충분하지 않습니다. 학교 폭력의 원인으로는 이 밖에도 원활하지 않은 교유관계’, ‘선생님과의 불화’, ‘호르몬 분비 과다’, ‘경제적 빈곤등 보기에도 제시하지 않은 더 많은 이유들이 있기 때문입니다.

Q: 최근 학교내 폭력이 증가하는 원인은 무엇이라고 생각하십니까? 보기중 직접 하나만 선택해주시기 바랍니다.

(1) 과열된 입시 (2) TV의 영향 (3) 게임의 영화 (4) 가정 불화의 증가

보기의 제시가 충분하지 않은 경우, 응답자들은 자신이 생각하는 보기가 없음에 따라 제대로된 선택을 할 수 없거나 응답 자체를 포기하기고 합니다. 이런 문제를 해결하기 위하여 충분히 보기의 갯수를 늘리거나, 주관식과 객관식의 특성을 혼합한 혼합형 보기를 제시하게 됩니다. , 아래와 같이 보기 예시중에 기타(_________________)’를 추가하고, 그 내용을 직접 적게 할 수도 있습니다.

Q: 최근 학교내 폭력이 증가하는 원인은 무엇이라고 생각하십니까? 보기중 직접 하나만 선택해주시기 바라며, 기타를 선택한 경우 그 이유를 직접 적어주시기 바랍니다.

(1) 과열된 입시 (2) TV의 영향 (3) 게임의 영화 (4) 가정 불화의 증가

(5) 기타 _____________________________________________________

() 보기의 갯수가 적절할 것 : 적절한 보기의 갯수를 생각해야 합니다. 보기의 갯수가 적으면 설문지의 가독성이 좋고 선택이 용이할 수 있지만 현실을 제대로 담아내지 못할 가능성이 있습니다. 반면에 보기 갯수가 너무 많으면 보기간에 중복될 우려가 있으며, 설문이 복잡해 집니다. 몇개가 적당한 보기 갯수인지를 일관적으로 정할 수는 없지만, 하나만 선택하도록 요구한 경우 9개를 초과한 보기는 적절하지 않아 보입니다. 만일 보기 갯수가 10개이상이라면, 응답자들에게 2개 이상의 보기를 선택할 수 있도록 하는 복수 응답을 허용해야 할 것입니다.

() 연구자가 임의의 결론을 유도하지 말 것 : 이는 질문을 제시할 때 질문의 내용중에 무의식인 전제를 부여함으로서, 응답자들이 연구자가 의도한 답변을 하도록 유도하는 경우입니다.

Q: 최근 대학의 등록금이 많이 올라 가계의 큰 부담이 되고 있습니다.

현재 대학의 등록금 수준이 어떻다고 생각하십니까?

즉 위의 질문은 이미 대학 등록금이 매우 비싸다는 연구자의 판단이 강력하게 제기되어 있어서, 등록금에 대한 공정한 응답을 기대하기 힘든 경우입니다.

  () 응답자에게 지나치게 상세하거나 민감한 응답을 요구하는 경우 : 실제 자신과 관련되어 있는 일일지라도 응답자들이 모든 사실을 알고 있는 것은 아닙니다. 일예로 현재 여러분이 사용하고 있는 한달 신용카드 사용금액이나 소금 섭취량, 혹은 도시가스 사용량을 정확히 알고 있는 분은 드물 것입니다. 따라서 지나치게 상세하고 정확한 답변을 요구한다면 응답자가 답변을 할 수 없을지도 모릅니다. 이런 문제를 피하기 위해서 응답자가 상세한 답변을 하기 어려운 답변은 응답의 범위를 제시하거나, 객관식 보기로 변경하여 물어보는 것이 효과적일 것입니다또한 너무 개인적인 프라이버시에 관련된 질문을 하는 것 역시 연구 윤리상의 문제가 될 수 있으며, 설사 응답을 하더라도 정직한 응답을 기대하기 어렵습니다. 일예로 이성 문제나 탈세 경험 등을 직접 물어보는 것은 결코 적절한 방법이 아닙니다.

() 요구하는 응답의 단위는 항상 정확히 제시할 것 : 마지막으로 가장 많이 범하는 실수중에 하나가 주관식으로 질문할 때, 단위를 정확하게 제시하지 않는 경우들입니다. 아래 문항을 보면 두가지 이유에서 적절한 질문이 아닙니다. 첫번째 문제는 흡연량의 측정 단위가 주어지지 않았다는 점입니다. 즉 설문 문항을 보완한다면, 일일 흡연량인지 혹은 주간, 월간, 연간 흡연량인지 제시하여야 할 것입니다. 두번째 문제는 측정 단위가 지나치게 클 수 있다는 점입니다. 만일 하루에 한두개피 정도 피는 흡연자라면 갑보다는 개피 수로 답하는 것이 보다 정확하며 타당할 것입니다.

Q1 : 당신은 보통 담배를 얼마나 피십니까? __________

5) 질문 순서의 결정 

이상의 검토를 통하여 개별적인 질문 항목이 결정된 이후에는 이들 문항들을 어떤 순서로 응답자들에게 제시할지 질문의 순서를 결정하여야 합니다특별한 원칙은 없지만 몇가지 팁(tip)을 제공하면 다음과 같습니다.

첫째, 첫번째 질문은 비교적 쉬우며 흥미를 유발할만한 문항들을 물어보는 것이 좋습니다. 이를 통하여 자연스럽게 응답자의 호응과 협조를 이끌어낼 수 있기 때문입니다.

둘째, 대답하기 어려운 민감한 질문들은 가능한한 설문의 마지막에서 물어보는 것이 좋습니다. 이럴 경우 내용이 민감할지라도 설문을 끝내야겠다는 책임감때문에 기꺼이 응답해주는 경우가 대부분이며, 설사 응답을 거부한다고 하더라도 최소한 부분적으로 설문에 답한 데이타는 남기 때문입니다. 특히 소득, 연령, 결혼여부 등을 확인하는 인구통계적 질문들은 관행적으로 맨 마지막 페이지에서 확인하고 있습니다.

셋째, 질문 문항들의 관계를 고려하여야 합니다. 이는 특정 설문 문항과 다른 설문 문항간에 연계성이 있는 경우들을 의미합니다. 일예로 스마트폰에 대한 만족도를 물어보는 설문 문항은 만드시 스마트폰 보유 여부를 물어보는 설문 뒤에 있어야 할 것입니다. 스마트폰을 가지고 있는 경우에는 다음 문항에서 자연스럽게 스마트폰의 만족도를 물어보고, 가지고 있지 않은 경우에는 만족도 문항을 건너뛸 수 있도록 별도의 지시문이 필요할 것입니다.

넷째, 불필요한 중복 문항이 있는지, 반드시 물어봐야 하는 문항인지를 고려하여 설문 문항의 숫자를 최소화하여야 합니다. 신뢰성을 검증하기 위하여 일부러 한두 문항을 중복되도록 배치하는 경우도 있지만, 이런 경우가 아니라면 비슷한 문항을 반복해서 물어보지 않도록 합니다.

6) 설문지의 편집 및 완성

자 이제 마지막 단계입니다. 설문지는 조사자가 응답자에게 제시하는 최종적인 인쇄물입니다. 도서 제작에 준하는 정도의 편집과 교정 노력이 필요합니다. 오자나 탈자, 잘못된 수식 등이 없는지 다시 확인하여야 하며, 설문의 항목중 누락된 부분이 없는지 이중으로 점검해야 합니다. 아울러 시각적으로 편안하고 아름다운 편집은 설문지가 주는 피로감을 덜어줄 수 있습니다.

4. 설문과 척도

설문을 작성할 때 또한 반드시 고려해야되는 것은 어떤 측정 척도를 사용하여 질문할 것인가를 결정하는 일입니다. 측정 척도의 정의란 설문 문항에서 얻은 응답 결과의 데이타가 어떤 성질을 가지고 있는가를 사전에 규정하고 설문지 작성에 임하는 것입니다.

측정척도는 크게 (1) 명목척도 (2) 서열척도 (3) 등간척도 (4) 비율척도의 4가지 형태중 하나를 가지고 있는데, 척도의 형태에 따라서 설문 조사로부터 얻은 데이타의 조작과 분석 방법의 선택에 제약이 가해지기 때문입니다.

예를 들어 마케팅조사론의 성적을 조사할 때 연구자는 여러가지 형태로 설문을 구성할 수 있습니다. 아래의 예를 보면 4가지 다른 설문 형태로 성적을 평가하는 문항들이 있습니다. 설문을 완료한 후, 이 설문지를 SPSS 데이타에 입력하면 모두 1이나 2 혹은 80과 같은 숫자로 입력될 것입니다. 그러나 같은 숫자라고 하더라도 각각이 의미하는 바는 매우 다르며, 일부는 숫자가 아닌 기호에 불과할 것입니다.

  (1) 명목 척도 : 위 보기에서 Q1는 명목척도의 예입니다명목척도는 단순히 대상이나 특성을 분류하는 목적으로 사용됩니다 가장 간단한 예로 농구 선수의 등번호는 단지 그 선수가 누구인지를 알려주는 기호일 뿐이며, 그 외 숫자로서의 기능은 하지 않습니다.

  (2) 서열척도 : 위 보기에서 Q2는 서열척도의 예입니다서열척도는 측정 대상간의 순서에 관한 정보를 제공합니다. 즉 크거나 작다는 정보, 높거나 낮다는 정보 등 순서를 제시해줍니다. 그러나 순서에 대한 정보가 곧 해당 속성의 양적인 비교를 가능하게 하지는 않습니다. 예를 들어 A학점 학생이 90점이고, B학점 학생이 89.5점이며, C 학점 학생이 70.5점인 경우를 생각해봅시다. 이 경우 A학점이 학생이 B학점 학생보다 잘한 것은 사실이지만 B학점과 C학점간의 차이에 비하면 그 차이는 매우 미미합니다.

  (3) 등간 척도 : 위 보기에서 Q3는 등간척도의 예이며, 양적인 비교가 불가능한 서열척도의 단점을 보완한 형태입니다. 등간 척도는 속성에 대한 순위를 부여하되, 순위 사이의 간격이 동일한 등간을 유지합니다. 그러나 임의적인 원점은 존재하지만 절대적인 원점은 존재하지 않습니다. 절대적인 원점이 존재하지 않을 경우에는 측정의 단위를 변경할 경우, 측정 값이 수시로 변경되는 제약점이 있습니다. 일예로 7점 척도인 Q3 문항에서 보통을 선택한 경우의 값은 ‘4’이지만, 만일 동일한 문항을 5점 척도로 물어본다면 그 값은 ‘3’으로 변화하게 될 것입니다.

  (4) 비율척도 : 절대 0점이 없는 등간 척도와 달리 비율척도는 아무것도 존재하지 않는 절대 0점의 개념이 있습니다. Q4의 경우를 보면 보통 0점 이하의 점수는 있을 수가 없을 것입니다. 몸무게를 생각해보면 0kg이하의 무게는 존재할 수 없습니다절대 0점의 존재는 매우 중요한데, 절대 0점이 있는 경우에는 비율의 비교가 가능해지기 때문입니다. , 40Kg의 몸무게는 20Kg보다 2.0배 무겁다고 이야기할 수 있습니다.

: 청주대학교 이 원준 (meetme77@naver.com)

728x90
728x90

1. SPSS 윈도우의 구성

SPSS를 제대로 설치한 경우 바탕화면이나 시작 버튼에 SPSS의 실행 아이콘을 쉽게 찾을 수 있습니다. 그리고 이를 더블 클릭하면 SPSS의 초기 화면이 나타나게 됩니다.

<SPSS 초기 화면>

우리는 이 초기 화면을 SPSS 윈도우(혹은 SPSS 창)라고 부릅니다. 그러나 실제 SPSS는 초기 화면에서 보여주는 윈도우외에도 8가지의 다양한 윈도우로 구성되어 있습니다. , 1) 데이타 편집기 윈도우, 2) 변수보기 윈도우, 3) 결과 뷰어(viewer) 윈도우, 4) 피벗표 편집기 윈도우, 5) 도표 편집기 윈도우, 6) 텍스트 출력결과 편집기 윈도우, 7) 명령문 편집기 윈도우, 8) 스크립트 편집기 윈도우의 총 8개 윈도우를 가지고 있으며, 이중 가장 빈번하게 활용되는 필수적인 윈도우는 데이타 편집기 윈도우, 변수보기 윈도우, 결과 뷰어 윈도우의 세가지 입니다. 본 과정에서는 이들 3가지 윈도우를 중심으로 각 윈도우의 역할과 기능을 간략히 설명드리도록 하겠습니다. 각 윈도우의 활용에 대한 상세한 사항은 과정이 진행됨에 따라 다시 설명드릴 기회가 있을 것입니다.

1) 데이타 편집기

데이타 편집기는 SPSS 실행시 바로 나타나는 초기화면으로서 가장 기본적인 화면입니다. 이 윈도우를 통하여 수집된 데이타를 상세히 살펴볼 수 있으며, 필요시 데이타의 추가 입력이나 편집 등을 할 수 있습니다. SPSS를 시작하면 처음 뜨는 엑셀을 닮은 초기 화면이 데이타 편집기입니다.

2) 변수보기 윈도우

데이타 편집기 파일을 살펴보면 좌측 하단에 데이타보기변수보기두 개의 탭이 존재하는 것을 볼 수 있습니다. 이중 변수보기 탭을 클릭하면 변수보기 윈도우로 전환할 수 있다. 변수 보기 윈도우는 사용되는 데이타의 변수 이름, 변수 유형, 소수점 자리수 지정, 변수에 대한 설명, 변수 값 이름 지정, 결측값 지정 등 다양한 변수의 특성들을 조사자가 지정할 수 있도로 해줍니다.

<변수보기 창>

3) 결과 뷰어 윈도우

결과 뷰어 윈도우는 SPSS를 이용하여 분석하였을 경우, 그 분석 결과를 보여주는 창입니다. 통계 분석을 시행한 경우 분석의 성공 여부와 관련없이 자동으로 팝업되며, 분석 결과를 제공합니다.

<결과보기 창>

4) 기타 윈도우

그 외, 기타 윈도우들에 대하여 간략히 요약하면 다음과 같습니다.

- 피벗표 편집기 윈도우 : 뷰어 윈도우에서 제시된 표를 더불 클릭하면 도표 편집기가 열리며뷰어 윈도우에서 제공되는 표를 편집하거나 수정할 때 사용합니다.

- 도표 편집기 윈도우 : 뷰어 윈도우에서 제시된 그래프나 챠트를 더불 클릭하면 도표 편집기가 열리며, 이들 도표나 챠트를 편집하거나 수정할 때 사용합니다

- 텍스트 출력결과 편집기 윈도우 : 분석 결과중 피벗 표나 도표 형태로 제시되는 제시되는 출력물 이외의 출력물을 편집하거나 수정할 때 사용하며, 텍스트 형태로 제시됩니다.

- 명령문 편집기 윈도우 : SPSSDOS 시절에 사용하던 명령어는 지금처럼 간단한 메뉴방식이 아니라 직접 프로그래밍 명령문을 입력하여야 하는 명령어(syntax) 형식이었습니다. 명령문 윈도우는 이처럼 분석 절차를 명령문 형태로 작성하여 사용하고자 할 때 주로 사용되며, 지금도 매크로 형태로 분석을 수행할 때 요긴하게 사용됩니다.

2. SPSS 파일의 종류

SPSS가 생성하고 이용하는 파일 형태는 다양합니다. 그중에서도 가장 자주 이용되는 파일 형태는 데이타 저장 파일인 sav 파일과 결과물 저장 파일인 spo 파일입니다.

1) 데이타 파일

데이타 파일은 데이터 편집기 윈도우에서 사용되는 파일로서 확장자는 입니. 별도의 지정을 하지 않는한 자동적으로 확장자 sav 파일로 저장되는데, sav 파일은 오로지 SPSS에서만 활용이 가능하며, 데이타 파일과 더불어 변수 보기 윈도우에서 지정한 변수의 특성을 동시에 저장하게 됩니다 만일 데이타를 다른 형태의 파일로 저장하기를 원한다면 다른 이름으로 저장메뉴를 사용하여 엑셀이나 txt 등의 범용 파일 포맷으로 저장할 수도 있으나 이 경우 데이타만이 변환된 포맷으로 저장되며, 변수 특성과 관련된 정보는 저장되지 않습니다.

<파일 유형의 저장>

2) 결과 뷰어 파일

결과물 파일은 뷰어 윈도우에서 사용되는 파일로 확장자는 spo 입니다. 분석 결과를 저장하고 추후에 결과만을 다시 확인해 볼 수 있습니다.

3. SPSS 메뉴와 도구상자

SPSS를 실제적으로 구동하기 위해서는 프로그램 메뉴에서 제시된 기능들을 선택함으로서 가능합니다. 이런 메뉴들은 SPSS 화면 상단에서 찾아볼 수 잇는데, 이를 메뉴 바라고 합니다. SPSS 버전에 따라 다소 차이가 있지만 보통 상단의 메뉴 바에는 10~12개 내외의 주요 메뉴가 제시되어 있습니다. 각 메뉴의 기능을 간략히 설명하면 다음과 같습니다.

<도구 상자>

1) 파일(F) : SPSS에서 사용되는 다양한 유형의 파일을 불러오거나 저장할 때 이용합니다.

2) 편집(E) : 데이타 및 결과물의 내용을 수정하거나 편집할 때 이용하며, 변수의 삽입과 삭제, 특정 데이타의 검색에도 이용할 수 있습니다.

3) 보기(V) : 상태표시줄이나 도구모음등을 숨기거나 표시할 때 사용할 수 있으며, 글꼴의 종류나 크기를 변경할 때도 사용할 수 있습니다.

4) 데이타(D) : 변수의 정의, 정렬, 케이스 선택 등 변수나 케이스를 다루는 모든 작업을 할 때 이용합니다.

5) 변환(T) : 기존 변수를 계산하여 새로운 변수를 생성하거나 코딩 변경 등 데이터를 조사 목적에 맞게 변형하거나 가공할 때 사용합니다.

6) 분석(A) : 실질적인 통계 분석과 관련된 거의 모든 작업을 할 때 이용합니다.

7) 다이렉트 마케팅(M) : 실제 마케팅 현장에서 필요한 고객 분석과 관련된 실무적 작업을 할 때 필요한 기능들을 별도로 모아놓았습니다.

8) 그래프(G) : 그래프를 활용하여 추가적인 분석 작업을 할 때 이용합니다.

9) 유틸리티(U) : 변수나 파일의 정보를 찾거나 변수군의 정의, 스크립트의 실행 등에 이용합니다.

10) (W) : 다양한 창 간에 이동을 하거나, 창의 크기를 조절할 때 사용합니다.

11) 도움말(H) : 프로그램을 이용하는데 도움이 되는 자습서, 사례 연구, 등록 정보 등이 제시되어 있습니다.

또한 SPSS는 다른 윈도우 기반 프로그램들과 마찬가지로 도구 모음 기능을 제공하고 있습니다. 평소 SPSS를 이용할 때 이용 빈도가 높은 기능들만을 모아 아이콘 형태의 메뉴로 제시한 것으로서 보다 손쉽게 프로그램을 이용하도록 도와줍니다. 이들 도구 모음과 메뉴에는 사실상 아무런 차이가 없으며, 단지 편의를 위하여 제공하는 추가 기능들입니다.

4. SPSS 분석 대화상자

SPSS의 주 메뉴에서 분석(A)'를 클릭할 경우, 연구 목적에 따라 다양한 종류의 분석을 선택하여 실시할 수 있습니다. 분석을 실시하기 위해서는 반드시 분석 대화상자를 이용하게 되는데, 분석 대화상자는 각 분석 방법에 따라 다소 모양의 차이는 있지만, 일반적으로는 아래 그림과 같은 기본 구조를 유지하고 있습니다. 분석 대화상자는 크게 1) 변수보기 박스 2) 투입변수 박스, 3) 옵션선택 버튼의 3개 파트로 구성되어 있습니다.

<분석 대화상자>

1) 변수보기 Box : 변수보기 박스는 분석대화상자의 왼쪽에 위치하며, 분석에 사용중인 데이타셋에 포함된 모든 변수의 목록을 전부 보여줌으로서 조사자가 필요한 변수를 선택할 수 있도록 합니다. 한개의 변수를 선택할 경우에는 해당 변수를 클릭한 후 박스 중앙의 을 클릭하면 투입변수 박스로 연구 대상이 되는 변수가 옮겨져 있는 것을 볼 수 있습니다. 만일 2개 이상의 변수를 동시에 옮기고자 할 때에는 쉬프트 키를 누른 상태에서 여러 변수를 클릭하면 동시에 많은 변수를 선택할 수 있습니다.

2) 투입변수 Box : 투입변수 박스는 분석 대화상자의 오른쪽에 위치하며, 분석에 투입될 변수만을 보여줍니다. , 분석되어야 하는 변수는 반드시 투입변수 박스 쪽으로 옮겨와야만 분석이 가능합니다.

3) 옵션선택 버튼 : 연구자의 의도에 따라 분석시 옵션을 선택하여 다양한 방식으로 통계를 처리할 수 있습니다. 옵선에는 보통 통계량이나 도표, 형식 등과 관련된 세부 사항들을 조정할 수 있으며, 별도의 옵션을 선택하지 않는 경우에는 프로그램에 사정에 지정된 기본 옵션에 따라 분석이 시행됩니다. 옵션에서 선택할 수 있는 상세한 설정 내용은 각 분석 방법의 종류에 따라 달라집니다.

: 청주대학교 이 원준(meetme77@naver.com)

728x90
728x90

"국내 대표 전자회사의 새로운 사업본부장으로 부임한 전00 상무는 유명 대학의 MBA 출신인 강 과장에게 신상품 기획안을 제출하라고 지시했습니다. 약속된 두 달이 한참 지나서 강 과장이 가져온 것은 허술하기 짝이 없는 석 장짜리 보고서. 내용을 찬찬히 살펴보던 전 상무는 깜짝 놀랐습니다. 대부분 작년 본사 마케팅 회의에서 기각됐던 내용을 그대로 재활용한 것이었기 때문입니다. 강 과장을 다그치자 돌아온 답은 현재 사업 중인 신사업 부문의 전체적인 시장규모를 정확히 알 길이 없고, 인접한 사업 영역도 어떻게 구성되는지 파악하기 힘드니 새로운 사업 아이디어를 내기가 어려운 건 당연하다는 논리였습니다. 그나마 영업사원들이 대리점들로부터 들은 풍문들을 바탕으로 시장을 분석하고 사업 기획안을 구성한 뒤, 인터넷 검색으로 찾은 데이터로 채워 넣은 그 보고서가 최선이란 항변이었습니다. 제너럴일렉트릭(GE)의 경우 2000년대 초반까지만 하더라도 전문 마케팅 조직을 두지 않았습니다. 일례로 항공기 엔진을 제조하는 GE에이비에이션의 경우 주요 경쟁사가 롤스로이스와 프랫앤드휘트니의 2개 회사뿐이었던 터라 마케팅 조사 같은 것은 필요 없다고 생각했습니다. 그러나 시장이 점차 성숙화하면서 GE 경영진은 급격한 유가 변동, 항공 수요 감소, 규제 강화 등 산업환경 변화에 대해 경영진 수준에서 명확하게 이해할 필요가 있다는 점을 깨달았습니다."

1. 마케팅 조사란 무엇인가?

도입 사례를 통하여 기업이 어떤 활동을 효과적으로 수행하기 위해서는 마케팅 조사가 반드시 수행되어야 할 과정임을 확인할 수 있었고, 그 중요성 역시 점차 강조되고 있음을 알 수 있었습니다. 그렇다면 마케팅 조사란 무엇일까요? 마케팅 조사는 오늘날 대부분의 소비자들에게 그리 낯설지 않는 단어입니다. 많은 사람들이 시장 조사 혹은 설문지와 같은 것을 손쉽게 연상하고는 있지만 무엇이 마케팅 조사인지에 관해서는 이해가 부족한 상태입니다. 그러므로 마케팅 조사에 대하여 바른 이해를 하는 것이 SPSS를 활용한 리서치의 첫 출발점이 되어야 할 것입니다.

마케팅조사란 마케팅 의사결정을 의한 실행가능한 정보의 제공을 목적으로 자료를 체계적으로 획득, 분석, 해석하고 보고하는 객관적, 공식적인 프로세스로 정의될 수 있습니다. 이를 보다 상세히 설명하면 다음과 같습니다.

1) 마케팅 의사결정 : 마케팅 조사 결과를 누가 주로 활용하는가를 고려했을 때, 일차적으로 상품기획, 마케팅전략, 광고, 고객 만족 등 다양한 부서에서 활동중인 마케터들이 마케팅 정보의 주된 소비자들이며, 이들이 보다 효과적인 의사결정을 하도록 지원해야 한다는 의미입니다. 마케팅 조사는 시장의 과거와 현재를 분석하고 미래를 예측하는 활동으로서, 반드시 마케팅 의사결정자가 당면한 문제 헤결에 도움을 주어야 한다는 의미입니다.

2) 실행가능한 정보의 제공 : 마케팅 조사의 최종 목표가 단지 통계나 자료의 제공이 아니고, 이를 가공한 의미있는 정보가 되어야 한다는 것을 의미합니다. 즉 시장에서 밝혀낸 사실들을 바탕으로 마케터의 직관과 경험이 결부됨으로서 실제 마케팅 프로그램에 반영이 되어야 함을 의미합니다.

3) 자료를 체계적으로 획득, 분석, 해석하고 보고 : 마케팅 조사가 단순히 설문지나 인터뷰를 통해서 질문하고 응답을 받아내어 기록하는 것 이외에 고도의 분석 및 해석과정이 포함되어야 하며, 기업 임직원 등 보다 상위의 의사결정자에게 보고됨으로서 기업이 시장지향적으로 운영될 수 있도록 해야 한다는 의미입니다. 다시 언급되겠지만, 마케팅 조사에 있어서 수집된 데이타를 정보로 요약, 가공하는 과정의 중요성은 점차 증대하고 있는 실정입니다.

4) 객관적, 공식적 과정 : 마케팅 조사가 조사와 무관한 의도나 목적을 합당화하기 위하여 조작되거나 편향되어서는 안되며, 신뢰성과 타당성을 확보해야 한다는 것을 의미합니다. 만일 객관성을 잃는다면, 데이타의 존재 가치가 무용해지며, 주관적인 의사결정과 아무런 차이가 없을 것입니다. 또한 공식적 과정이라는 것은 마케팅조사 프로세스가 명확히 사전에 규정되고 설정되어 통일성과 일관성을 확보해야 한다는 것을 의미합니다. 따라서 마케팅 조사는 사전에 철저히 준비된 조사 계획과 가이드라인에 따라서 체계적이고 과학적인 프로세스를 통하여 이루어져야 할 것입니다.

2. SPSS 개요

이런 과학적이고 체계적인 마케팅 조사를 도와주는 필수적 소프트웨어가 바로 SPSS입니다. 본격적으로 시작하기 전에, SPSS란 무엇인가에 대하여 간단히 살펴보도록 하겠습니다. 오늘날 많은 분들이 통계를 어려워하십니다. 통계하면 복잡한 수식과 숫자들이 먼저 떠오르기 때문이지요. 이처럼 과거 시장조사와 통계처리는 고도의 숙련된 통계 전문가와 더불어 값비싼 메인 프레임급 컴퓨터를 이용하여 이루어져오던 고도의 전문화된 영역이었습니다. 그러나 최근 급속하게 발전된 컴퓨터의 사양과 성능은 통계처리 방식에도 큰 변화를 불러일으키면서, 통계와 마케팅 조사라는 영역을 통계 전문가의 손에서 평범한 마케터에게로 옮겨 놓게 되었습니다. 이제 약간의 조사와 컴퓨터 관련된 지식만 있다면 누구나 손쉽게 필요한 통계 분석을 할 수 있는 시대가 도래하였습니다.

이런 변화의 중심 속에는 오랜 세월동안 마케터들에게 애용되어오면서 발전을 거듭해온 SPSS라는 통계처리 소프트웨어 프로그램이 있었습니다. SPSSStatistical Package for the Social Science의 약자로서, 사회과학을 위해 개발된 통계 패키지 프로그램을 의미합니다. 경영학은 물론이고 심리학, 사회학, 교육학, 신문방송학 등 사회과학의 제 분야에서 핵심적으로 이용되고 있는 통계 프로그램 입니다.

이와 유사한 프로그램들로 SASMinitab, r 등 다른 통계 프로그램들이 더러 있지만, SPSS80년대말부터 이미 DOS 프로그램용으로 개발되어 사용되어왔으며, 1993년 최초로 윈도우용 버전인 SPSS 5.0이 출시된 이후로 가장 표준적인 통계 패키지로 빠르게 자리잡았습니다. 최근에도 SPSS는 거의 매년 버전 업그래이드를 하면서 빠르게 변화하고 있습니다. 그 결과 인터넷이나 자료실 등에서 구할 수 있는 SPSS 평가판의 버전은 낮은 버전으로는 SPSS 12에서 높게는 SPSS 21 등 다양한 버전들이 있으며, 한글판과 영문판 등 다양한 언어로도 선택적으로 배포받을 수 있습니다.

최근 r이 무료 오픈소스라는 장점과 다양한 적용성으로 큰 인기를 끌고 있습니다. 분명히 r은 매우 훌륭하고 미래가 밝은 통계 프로그램입니다. 그러나, 여전히 사용성이나 편리성 측면에서는 개선 소지가 많고, 코딩을 익혀야 하는 등 배우는 과정에 시간과 노력이 많이 소요됩니다. 어떤 통계 툴을 써도 통계 결과가 크게 다르게 나올리는 없습니다. 자신에 맞는 툴을 사용하시면 됩니다. 개인적으로 r은 빅 데이타 처리, 비쥬얼라이제이션에 강점이 크고, spss는 표준 도구로서 어느 목적에도 사용이 가능한 다목적이라고 생각됩니다.

본 콘텐츠는 다양한 통계 도구 중에서도 현재 손쉽게 구할 수 있고 비교적 프로그램 버그 등이 제거되어 안정적인 SPSS 한글판을 기준으로 강의가 진행될 예정입니다. 그러나 혹시 수강생 여러분들이 다른 버전, 혹은 영문판 등 다른 버전의 SPSS를 가지고 있다고 하더라도 기본적인 수강이나 학습에 큰 문제는 없으리라 생각됩니다. 본 교과목에서 다루고자 하는 기본적인 분석 메뉴는 모든 버전에 동일하게 들어가 있으며, 단지 메뉴의 위치나 프로그램 대화 창의 인터페이스 디자인들만이 살짝 다른 정도이기 때문에 수강에 지장은 없으리라 판단됩니다. 또한 어떤 버전을 사용하더라도 SPSS 프로그램이 분석 후 제공하는 결과 값은 아무런 차이가 없습니다.

3. SPSS를 운영하기 위한 컴퓨터 환경

최근 컴퓨터 하드웨어의 성능이 소프트웨어의 성능을 뛰어넘은지 오래되었기 때문에 SPSS를 운영하기 위한 별도의 PC 성능에 대한 고려는 그다지 중요하지 않을 것이라고 생각됩니다. 사실상 현재 운영되고 있는 거의 모든 PC에서 SPSS는 안정적으로 설치되고 작동합니다. 실제로 마이크로소프트 오피스가 운용될만한 수준의 PC 환경이라면 SPSS는 무난한 성능을 보여줄 것입니다그러나, 오랜 시간 SPSS를 사용해본 경험을 바탕으로 몇 가지 권장 사항을 정리하면 다음과 같습니다.

첫째,  SPSS는 윈도우 환경에서 최적 작동합니다. 애플 매킨토시 버전의 SPSS도 출시되기 시작했지만, 이를 안정적으로 사용하기 위해서는 윈도우 XP이상의 환경이 필요합니다.

둘째, 램은 1기가 이상이면 무리가 없이 작동합니다. 다만, 처리해야 되는 데이타의 양이 기하급수적으로 증가하는 경우, 램의 크기와 성능에 따라 계산 속도가 증가하기 때문에 램은 다소 여유가 있는 것이 좋습니다.

셋째, 특히 본 과정에는 큰 모니터 화면 사이즈가 편리함을 제공할 수 있습니다. 본 교과목의 사어버 강좌를 띄어놓고, 동시에 SPSS 프로그램을 실행하면서 따라해야할 경우가 많기 때문에 가능하면 넓은 화면이 보다 편리할 것입니다.

그러나 위에서 말씀드린 SPSS를 운영하기 위한 최적 환경이 아닐지라도, 소형 노트북의 작은 화면에서도 SPSS는 여러분의 PC에서 큰 문제없이 잘 작동되기 때문에 컴퓨터 환경으로 인한 큰 장애는 없을 것으로 생각됩니다.

4. SPSS의 설치

이제 실제로 수업을 진행하기 이전에 여러분의 PC에 직접 SPSS 프로그램을 설치해볼 차례입니다. 여러분이 설치해야되는 SPSS 프로그램은 고가의 상용 프로그램이므로 본 강좌에서 설치용 파일을 제공하지는 않습니다. 여러분이 직접 개별적으로 구매해서 설치하거나, 혹은 일정한 정해진 기간에 한해서 사용이 가능한 체험판을 구해서 직접 설치하여야 합니다. 그러나 뛰어난 성능에 걸맞게 SPSS 프로그램의 가격은 매우 비싼 편이기 때문에 대부분 프로그램을 직접 구매하기 보다는 수업을 위하여 체험판을 설치하게 될 것입니다.

체험판을 구하기 위하여 네이버나 다음 등을 검색하게 되면 SPSS 12.0부터 최근 버전까지 다양한 버전들의 체험판을 다운로드 받을 수 있습니다. 그러나 최신 버전을 다운로드 받고, 프로그램에 관련된 추가적인 정보등을 얻기 위해서는 SPSS의 공식 홈페이지를 방문할 것을 권합니다. SPSS의 한국내 홈페이지 주소는 www.spss.co.kr 입니다.

<SPSS 홈페이지>

자 이제 SPSS 홈페이지를 방문하셨으면, 회원 가입후 최신 SPSS 프로그램의 평가판을 다운로드 받아봅시다. 다운로드 받기 위해서는 화면 상단의 바로가기 메뉴 중 제품을 클릭한 후에, 화면 우하단에 평가판 다운로드 바로가기 배너를 클릭하면 됩니다. 설치 방법은 다른 일반적인 프로그램들과 마찬가지로, 라이센스 계약을 읽은 후 화면이 제시하는 순서에 따라 설치를 하시면 큰 어려움 없이 설치가 가능합니다. 직접 다운로드 후 해당 프로그램을 여러분의 PC에 설치해 보시기 바랍니다.

이제 설치가 완료되었는지요? 설치가 완료된 이후에는 찬찬히 SPSS사의 홈페이지에는 어떤 정보들이 들어있는지 둘러보는 것도 좋을 것 같습니다.

우선 SPSS 홈페이지에서는 SPSS 프로그램과 관련된 다양한 도서와 프로그램 매뉴얼을 구입할 수가 있습니다. 여기서 판매되는 책들은 심도있는 통계적 지식들을 다루고 있지는 않지만 프로그램 이용법 위주의 간단한 개요서들로서 프로그램과 친숙해지는데 도움을 줍니다.

또한 자료실로 가면 SPSS를 활용하여 작성된 논문이나 보고서, 설문지, SPSS 데이타 파일 등의 예를 다운로드 받아 볼 수 있으며, Q&A 형태로 프로그램에 대한 질문 등을 주고 받을 수 있는 공간들이 있습니다. 앞으로 필요한 정보들이 있을 때 SPSS 웹 사이트를 많이 활용해 보시기 바랍니다.

: 청주대학교 이 원준(meetme77@naver.com)

728x90

+ Recent posts