728x90

[Jamovi 통계] 4. 기술통계와 그래프 그리기

데이터 입력 과정을 잘 이해하고, 코딩까지 마친 이후에는 이들 데이터를 가지고 본격적인 분석을 시행하게 된다. 이하 별도의 다른 안내가 없을 시, 향후 본 jamovi 실습의 데이터는 여러분이 3장에서 직접 입력한 '코로나 바이러스 이후의 소비자 행동'에 관한 실제 설문자료를 사용하게 될 것이다(본 데이터의 변수 정의와 설문문항은 3장 참조: https://sooupforlee.tistory.com/138?category=882298).

데이타546명.omv
0.01MB

1) 기술통계란?

기술 통계는 표본 자체의 속성을 파악하여 묘사는데 주안점을 두고 있는 분석 방법이며, 기술을 의미하는 description은 이를 잘 표현한다. 기술통계는 주로 표본에 속한 대상자들의 인구통계적 특성이나 데이터가 보여주는 공통적 특성을 요약하여 보여주는 것이 주목적이다. 이를 통하여 방대한 데이터도 합리적으로 요약하고 정보처리의 수고를 덜 수 있다. 일예로, 우리는 미국인들은 진취적이며, 프랑스인들은 예술을 사랑한다고 생각한다. 물론 미국인들중에도 소극적인 사람도 있고 프랑스인들중에도 예술에 무관심한 사람들이 적지 않을 것이다. 우리는 이런 예외가 항상 적지않게 있음을 충분히 알고 있음에도 불구하고, 이들의 국민성을 한 눈에 파악할 수 있는 정보가 유용하다는 것 역시 잘 알고 있다. 나중에 어떤 통계분석을 하더라도 기술통계를 통하여 표본 전체의 전반적인 속성을 정확하게 파악하는 것은 거의 모든 통계분석의 기초가 된다. 

여러가지 기술통계량이 있지만, 주요한 통계량으로는 가) 중심경향성, 나) 산포도, 다) 분포, 라) 백분위수 정도가 이용된다. 각각의 설명은 다음과 같다. ** 본 기술통계량이 중요한 이유는 대학원이나 연구기관의 학술적인 데이터 분석인 경우를 제외하고, 일상적인 데이터 분석이나 소비자 조사 등 리서치에서는 대부분의 데이터 분석들이 기술통계량을 위주로 이루어진다는 점이다. 기술통계량은 분석 자체도 쉽지만, 수학이나 통계에 대한 지식이 없어도 직관적으로 이해가능하기 때문에 사실상 거의 대부분의 일상적 기업실무에서는 기술통계만이 쓰이는 경우도 적지 않다. 물론 회귀분석이나 신경망 분석도 고도의 통계분석의 사용도 증가하고는 있지만, 이는 나중에 필요하다면 추가로 배워나가면 될 뿐이다.**

  가) 중심 경향성

: 중심 경향성이란 용어 그대로  데이터가 중심을 중심으로 퍼져있는 경향을 나타내는 통계량이다. 일예로 100명이 본 시험 점수가 0점부터 100점까지 고르게 분포되어 있다면, 우리는 대부분의 사람들, 특히 중간에 속한 사람의 점수는 0점이나 100점이 아니라는 것을 안다. 기술통계량은 이 중간에 속한 사람이 누구인지 확인하게 도와준다. 이를 확인할 수 있는 대표적인 값은 여러가지가 있는데, 우선 평균(mean), 중위수(median), 최빈값(mode)이다. 평균은 이미 익숙한 개념이고, 중위수는 100명의 성적 서열(순서)을 매겼을때 가장 가운데 위치한 사람의 점수를 의미하는 값이다. 반면에 최빈값은 100명의 성적중 가장 많이 발견되는 빈도의 값이다.

 나) 산포도

: 산포도는 표본의 속성을 나타내는 데이터가 퍼져 있는 정도를 설명하는 통계량으로서 최대값, 최소갑, 범위, 분산, 표준편차, 표준오차 등이 있다. 이중 최댓값(maximum)과 최소값(minimum)은 각각 데이터에서 가장 작은 값과 가장 큰 값을 나타내며, 범위(range)는 최대 및 최소값 간 차이, 즉 '최대값-최소값'을 나타낸다. 그러나 이 세 가지 통계량은 여전히 데이터의 전반적인 흩어짐과 변화량에 대한 정확한 정보를 제공해 주지 못한다. 일예로 두 학급의 평균이 70점으로 동일하더라도, A반은 성적 분포가 0점~100점까지 극단적이고, B반은 성적이 60-80점 사이로 큰 차이가 없을 수 도 있다. 이런 데이터의 흩어짐 정도에 대한 정보가 없다면 우리는 어떤 교사가 더 편애없이 잘 지도했는지 알기가 어려울 것이다. 이를 위해 또 다른 산포도 통계량, 즉 분산, 표준편차, 그리고 표준오차가 필요하다. 분산, 표준편차, 그리고 표준오차는 기본적으로 각 데이터가 평균으로부터 떨어진 거리들에 대한 평균 개념으로 이해하면 무방하다. 자세한 설명은 본 과정의목표를 넘어가므로 생략하며, 통계원론 등에서 찾아보기 바란다.

 다) 분포

: 데이터 분포의 형태와 대칭성을 보여주는 통계량으로, 보통, 첨도(Kurtosis)와 왜도(skweness)를 본다. 첨도는 데이터의 정규분포도가 뾰족한 정도를, 왜도는 데이터의 분포가 뾰족한 정도를 보여준다.

 라) 백분위수

: 데이터를 4분위의 집단으로 나누고 각각에 해당되는 퍼센트를 보여준다

728x90

2) Jamovi 기초적인 기술통계

본 조사에 응답한 응답자의 성별 여부를 확인하여 우리는 남성과 여성의 %, 그리고 응답자의 평균적인 연령을 각각 살펴볼 것이다. 이를 위하여 우선 기본적인 기술통계를 위하여 '데이터546명.omv'라는 데이터 파일을 우선 연다. 그 이후의 단계는 간단하다. 상단의 '어날리세스' 메뉴 탭을 선택하고, 'Exploration(탐색)' -> 'Descriptives(기술)'을 차례로 선택한다.  그러면 다음과 같은 형태로 분석 창이 변화될 것이다. 기술통계의 기술은 '묘사하거나 서술한다(descript)'는 의미로 사용되고 있음을 알 수 있다. 즉 데이터를 요약하여 어떤 응답을 했는지 함축적으로 보여주는 매우 기초적인 분석이며, 주로 평균이나 빈도(%)의 형태로 데이터를 함축적으로 보여준다.

분석창의 설정

Jamovi는 분석과 결과보여주기 모두 매우 직관적인 방식을 택하고 있다. 분석 화면의 좌측에는 분석이 가능한 모든 변수들(변수 전체)를 보여주고 있는데, 이중 분석하고 싶은 변수들만 화면 우측의 'Variables'에 클릭하여 가져자 놓으면 된다. 그러면 친절한 Jamovi는 어떤 결과 값이 나왔는지를 실시간으로 바로 보여주게 된다. 화면의 'split by'는 분석값을 특정한 기준을 중심으로 나누어보고 싶을때 사용하는 메뉴이며, 이는 추후에 설명한다. 바로 그 아래에는 'Frequency table' 옵션을 지정할 수 있으며, 지정 시 빈토(%) 결과값을 보여준다.  추가적으로 분석 화면의 하단에 보면 두개의 옵션 메뉴가 숨겨져 있다. 즉 'Statisics'와 'Plots'이다. 우선 'Statisics'를 클릭하면 평균, 최빈값, 중앙값, 분포값, 퍼센타일 값등 다양한 추가 통계자료를 보여준다.  'Plots'은분석결과를보기좋은그래프형태로보여준다.

우선 테스트로 응답자의 평균 연령을 살펴보자. 이를 위해서는 단지 분석가능한 변수들중에서 연령(age)를 'Variable'창에 옮겨다 놓으면 된다. 결과값은 자동으로 산출된다. 추가적으로 응답자 성별(gender)를 분석해보자. 남녀 성별을 평균으로 본다는 것은 결과 값은 기계적으로 나오긴 하지만 아무런 의미가 없다. 이 경우 gender 변수를 'Variable'창에 옮겨놓은다음 아래의 'Frequency table' 옵션창을 클릭하면 된다. 추가적 통계옵션이 필요한 경우에는 옵션창에서 추가로 선택할 수도 있다. 

분석 케이스

분석 결과를 보면 Jamovi의 오른편 화면에 원하는 통계결과와 관련된 참고문헌이 실시간으로 나타나는 것을 볼 수 있을 것이다. 이로서 간단한 평균이나 빈도(%)의 분석을 할 수 있게 되었다. 분석해보고 싶은 다른 변수들이 있으면 자유롭게 분석해본다. 이를 통하여 우리는 척도의 특성(명목, 등간, 비율 등)에 따라서 어떤 분석방법이 적합한지, 혹은 적합하지 않은지 앞서 배운 내용을 상기하면서 체험할 수 있을 것이다. 일예로, 그래프(plots) 작성은 데이터 특성이 적절하지 않으면 옵션에서 지정을 하더라도 그래프를 산출해주지 않을 것이다(중국집에서 스테이크를 주문하는 경우를 생각해보자. 주문하더라도 결코 스테이크는 나오지 않는다).

 

728x90
728x90

2. Jamovi 설치/준비하기 

1) Jamovi 설치하기

오픈소스 통계 패키지중에서도 Jamovi는 SPSS보다 뛰어난 성능과 편의성을 자랑한다. 일 예로 SPSS에서는 데이터보기 창과 분석결과 창이 별개의 윈도우로 제공되지만 Jamovi에서는 하나의 화면에서 데이터와 분석 결과를 실시간 점검할 수 있다. 무료 패키지라는 장점 외에도 업데이트가 빨라 새로운 최신 기능도 다양하게 선택적으로 사용할 수 있다. 

Jamovi를 설치하기 위해서는 우선 프로그램을 다운로드하여야 한다. Jamovi 다운로드를 위한 인터넷 접속은 모든 브라우저에 가능하나, 가급적 구글 크롬의 사용을 권장한다. 다양한 디지털 데이터 분석과 데이터 마케팅 플랫폼이 구글 중심으로 빠르게 재편되고 있기 때문에 평소에 구글 크롬 브라우저는 기본 브라우저로 사용하는 습관이 편리하기 때문이다. 다른 통계 패키지에서 보기 힘든 특징으로 .Jamovi는 클라우드(cloud) 버전도 지원한다. 즉, 프로그램의 설치 없이도 웹(cloud.jamovi.org)에 접속하여도 동일한 기능의 이용이 가능하다. 이는 여러가지 편리함을 제공하는데, 스마트폰의 웹 접속이나 공용 PC 등에서도 간편하게 이용이 가능하다는 것은 큰 장점이다.

Jamovi 웹사이트(https://www.jamovi.org/) 를 방문하면 다양한 버전의 설치 파일을 선택할 수 있는데, 우선 솔리드(solid) 버전과 커런트(current) 버전의 차이점을 알아야 한다.  보통 커런트 버전은 현재까지 개발된 최신판이지만 아직 기능이 다소 불완전할 수 있어서 에러가 발생할 가능성이 있는 반면, 솔리드 버전은 검증을 통하여 보다 안정된 버전이다. 그러나, 실제로 두 버전간의 차이는 사실상 크지 않아서 어느 것을 설치하여도 무방하다. 이하 본 블로그에서는 솔리드 버전을 설치하고 설명한다.

Jamovi 다운로드 버전

설치 파일의 사이즈는 약 200메가 이하이며, 설치 과정은 단순히 안내 창에 따라 따라가면 되기 때문에 어렵거나 고민해야되는 부분은 없다. 설치가 종료되고 실행되면 Jamovi의 기본적인 화면이 등장한다. Jamovi는 하나의 화면에서 데이터분석과 결과 보기를 할 수 있도록 디자인되어 있어서, 화면 좌우를 중심으로 데이터 보기창과 결과보기 창이 동시에 나타난다. 그리고 기본적인 통계 분석 기능이 자동으로 제공된다. Jamovi는 연구자의 필요에 따라서 기타 다양한 통계 분석 도구들을 추가할 수 있다. 이를 위해서는 메뉴 화면 맨 우측의 모듈(+) 이라는 메뉴를 추가하면 현재까지 설치된 통계 모듈과 추가 설치가능한 통계 모듈을 확인할 수 있다. 이 통계 모듈은 오픈소스 개발자들의 노력을 통하여 수시로 업데이트되거나 추가되기 때문에 Jamovi의 기능이 향후 계속 확장될 수 있음을 보여준다.

Jamovi 실행 후 모듈 추가

 

728x90

2) Jamovi 화면과 메뉴

Jamovi 설치가 완료된 후 실행하면 화면 상단에 아이콘 형태로 제시된 메뉴 영역이 있으며, 그 메뉴 화면 아래로는 좌우로 분할된 두개의 윈도우 창이 나타난다. 좌측의 윈도우 창은 분석에 사용되는 데이터들을 보여주는 역할을 하며, 우측의 윈도우 창은 분석된 통계 결과들을 보여주는 역할을 한다. 우선 화면 상단의 메뉴는 '데이터' 탭과 '어날리세스(분석)' 탭을 선택하면 아이콘 메뉴가 탭에 따라서 변경되는 것을 볼 수 있다. Jamovi의 기본적인 작동 방식은 다음과 같이 단순하다.

   가. 분석 업무의 내용에 따라 우선 데이터 탭 혹은 어날리세스 탭을 선택한다. 데이터 탭은 데이터의 정리가 가공 등 분석 이전의 데이터 전 처리를 위하여 주로 사용하게 되고, 어날리세스 탭은 어떤 통계분석을 시행할지를 선택하게 된다.

  나. 메뉴 아래 좌측의 데이터 보기 윈도우에 분석 대상인 데이터와 변수명이 적절하게 표시되었는가를 확인한다.

  다. 분석 탭을 클릭한 후, 원하는 통계분석을 선택한다.

  라. 메뉴 아래 우측의 결과보기 창에 나타난 통계 결과를 확인한다. 

Jamovi 메뉴 및 윈도우 설명

각 탭들의 기본적 메뉴들을 간단히 살펴보면 다음과 같다.

가) 데이터 탭

: 데이터 탭에서는 분석을 위하여 자료를 준비하거나 변수(variable)의 속성값을 지정하고, 기존의 변수와 데이터를 새로 추가, 변경, 삭제하는 기능을 제공한다.

데이터탭 그래픽 메뉴 

나) 어날리세스(분석) 탭

: 분석 탭에서는 적절한 통계 분석을 실시할 수 있게 해준다. 처음 설치하면 기술통계(Exploration, Frequencies)와 그외  많이 쓰이는 기본적인 통계도구(T-test, ANOVA, Regression)들만 이용가능하며, 모듈 투가를 통하여 보다 다양한 통계분석을 이용할 수 있다.

어날리세스탭 그래픽 메뉴

이는 어날리세스 탭의 메뉴의 맨 우측의 'Modiule' 아이콘을 클릭하면 드롭다운(drop-down) 메뉴를 통하여 원하는 기능을 설치하면 추가 기능의 이용이 가능하다. 이들 추가 기능은 고급 통계기능까지 포함하여 매우 다양하며, 오픈소스 개발자 커뮤니티를 통하여 새롭고 강력한 기능이 계속 추가된다는 것은 SPSS 등 사용 프로그램들과 비교시 가장 큰 장점이기도 하다. 특히 모듈을 추가할 경우, 기존 SPSS에서는 값비싼 확장팩을 통해서도 이용할수 없었던 확인적 요인분석(CFA분석), 매개효과(mediation)와 조절효과(moderation) 분석, 메타(Meta) 분석 등의 고급 통계 기능들도 손쉽게 이용가능하다는 점은 Jamovi만의 매우 큰 매력이 아닐 수 없다.

모듈의 추가 기능

다) 파일 관리 메뉴

: 화면 상단의 맨 좌측의 파일관리 탭을 클릭하면 불러오기, 저장하기, 파일이름 바꾸기 등 기본적인 파일관리 기능을 활용할 수 있다.

728x90
728x90

1. Jamovi 와 오픈소스 통계 패키지

1) 통계 패키지 소프트웨어

컴퓨터를 이용한 통계분석이 보편화된 이후, 주변에서 통계 소프트웨어를 사용하는 경우를 보는 것은 어려운 일이 아니다. 통계분석자들이 가장 흔하게 사용하는 통계 팩키지 프로그램은 SPSS를 필두로 SAS, Minitab 과 같은 상용 프로그램들이 있으며, 최근에는 r 등 새로운 프로그램들이 인기를 끌고 있다. 가장 잘 알려지고 보편적으로 사용중인 프로그램은 여전히 SPSS지만 각자 프로그램들은 자신의 영역에서 활약을 하고 있다. SPSS는 GUI (graphic user interfeace) 기반으로 오피스 프로그램에 익숙하다면 쉽게 조작할 수 있으며, 매년 버전 업을 통해서 방대하고 강력한 통계분석 기능을 자랑하고 있다. 최근에는 SAS나 MINITAB 등 경쟁 패키지도 점차 사용편리성 개선을 위하여 노력하고 있는 실정이다. 

그러나 이런 강점과 편리성에도 불구하고 일반인이 손쉽게 구매하기 힘든 고가의 패키지라는 것이 가장 큰 제약사항이다. 개인적 목적으로 구매할 경우 최소 수백만원을 호가하며, 기업이 구매할 경우 억 단위가 넘어간다. 또한 확장 기능을 부가할때마다 더 많은 추가 비용을 지불하여야 한다. 대부분의 대학들은 50인 내외의 소규모 라이센스 계약을 통하여 교육에 활용하고는 있지만, 대학을 벗어나는 순간 이런 고가 패키지를 이용하기는 쉽지 않다. 일반적인 중소규모의 기업은 물론이고, 대기업에서도 특별한 용도로 구매한 경우가 아닌 다음에야 현업에서 구경하기가 쉽지 않다. 여론조사나 마케팅 리서치 업체 정도에서나 갖추어놓은 경우가 많다. 전문적인 교육을 받고도 가격적 장벽으로 현업에서 사용하지 못하는 문제점들을 극복하기 위해서 누구나 무료로 사용할 수 있는 오픈소스 기반의 통계프로그램들이 등장하고 있으며, 대표적인 운동이 R project이다 (https://www.r-project.org). R은 통계 분석과 관련 그래픽 도출을 위한 완전한 무료 패키지이며, 윈도우, 맥OS, 그리고 리눅스 같은 다양한 플랫폼에서도 운영이 가능하며, 커뮤니티 중심으로 개발자들이 새로운 패키지를 계속 개발하는 유연한 프로그램 이라는 장점이 있다. 현재 2020년 기준으로 적어도 5,000개 이상의 R 패키지들이 개발되어 있다.

R이 이런 장점을 바탕으로 빅 데이터 분석 등 최근 급부상한 통계 영역에서 인기를 끌고 있지만, SPSS 등 기존 프로그램들을 충분히 대체하고 있지는 못하다. 이는 R이 GUI 형태의 소프트웨어가 아니라 일일이 code를 짜서 입력해야 하는 프로그래밍 개발 도구의 형태를 가지고 있기 때문이다. 최근에는 통합개발환경(IDE)인 'R Studio'의 이용을 통하여 다소 편리해졌다고는 하나, GUI 환경에 비할 바는 아니다. 프로그래밍 방식에 따른 개발의 유연성은 장점이 될 수 있지만, 결국 일반 사용자들에게 외면 받는 이유가 되고 있다. 과거 SPSS가 80년대까지는 지금의 r과 똑같은 프로그램 방식을 취하였지만(지금도 SPSS에서 GUI가 구현되지 않은 일부 고급분석 기능(예: conjoint 분석)을 이용하거나 맞춤형 테이블을 대량 출력할 경우에는 여전히 Syntax 코드를 짜야만 한다), 개선을 거듭하여 편리한 사용환경으로 진화한 것을 고려하면, 대중화를 위해서는 현재의 R은 편의성이 크게 부족하다. 

SPSS의 Syntax 코드

2) 오픈소스 기반 통계 패키지

이에 대한 대안으로 최근에는 무료 공개 통계프로그램들도 R과 같은 강력한 통계분석기능과 다양한 OS 플랫폼 지원의 장점은 그대로 유지하면서, SPSS 처럼 편리한 GUI를 갖추고 공개되고 있다. 이런 프로그램의 대표 주자가 PSPP, JASP, 그리고 Jamovi 이다. PSPP (https://www.gnu.org/software/pspp)는 기존에 SPSS에  익숙하였던 사용자가 SPSS를 대체하기에 적합하다. 기존 SPSS와 100% 동일한 GUI와 메뉴 체계를 가지고 있어서 아무런 추가적 학습이나 노력없이 SPSS 사용 경험을 그대로 이용할 수 있다. 당연히 무료이기 떄문에 SPSS 데모판처럼 시간 제한이나 라이센스 문제는 발생하지 않으며, 기능 역시 SPSS 확장판의 통계분석 기능 대부분을 가지고 있다. 10억개 이상의 변수나 응답자 처리가 가능한 것도 장점이다. 또한 기존 SPSS와 데이타파일의 완벽한 호환이 가능하여 과거 사용하였던 SPSS 파일을 분석하거나 타 SPSS 사용자와 데이터 교환 등이 가능하다.

SPSS와 동일한 경험을 제공하는 PSPP

또 다른 대안은 JASP (https://jasp-stats.org)나 Jamovi (https://www.jamovi.org)를 이용하는 것이다. JASP의 개발자중 일부가 독립하여 Jamovi를 개발에 참여하고 있기 때문에 이들 프로그램의 개발 철학이나 이용방식 등은 매우 유사하다. 이들 프로그램은 모두 무료 공개 프로그램이며 SPSS나 SAS와 비교해서도 더 사용하기 편리한 GUI를 갖추고 있다. 또한 이들 프로그램들은 R 통계 언어에 기반하여 구현되었기 때문에 R의 강력하고 유연한 기능을 모두 사용할 수 있다. 평소에는 GUI 형태로 통계 패키지를 이용하지만, 사용자가 R code를 직접 운용하고 싶은 경우에도 패키지 안에서 R 실행이 가능하다. 또한 비교적 개발자 커뮤니티가 작은 규모인 PSPP에 비하여 큰 규모의 R 커뮤니티가 참여하고 있기 때문에 더 빠르게 업데이트되고 더 다양한 기능 모듈들이 수시로 업데이트되고 있는 것도 큰 장점이다. SPSS 등 유명 통계 패키지와의 데이터 호환성도 갖추고 있다.

Jamovi Project

여러가지 사용 옵션이 있지만, 만일 직장에서 이미 SPSS나 SAS 등의 라이센스를 구입하였고, 많은 데이터 아카이브가 구축되어 있다면 당연히 기존 패키지를 사용하는 것이 최선일 것이다. 그러나 그렇치 않은 경우의 대안으로서 이들 공개 프로그램들은 매우 훌륭하다. SPSS에 익숙한 경험을 버리고 싶지 않은 경우에는 PSPP를, 새롭게 배우기 시작한 경우에는 JASP나 Jamovi를 선택할 수 있다. 특히 Jamovi는 SPSS를 능가할 정도의 다양한 통계 모듈들이 빠르게 추가되고 있고, R 의 확장성을 그대로 가지고 있다는 점에서 추천할 만하다. 윈도우와 맥OS, 그리고 리눅스 등 다양한 환경에서 작동되기 때문에 다양한 운영체제를 가지고 있는 학생들 대상의 교육에 있어서도 적절한 측면이 있다. 본인도 역시 고사양의 PC에는 SPSS를 운영하고 있지만, 저사양의 리눅스에서는 Jamovi를 활용하고 있다.

 

728x90
728x90

"국내 대표 전자회사의 새로운 사업본부장으로 부임한 전00 상무는 유명 대학의 MBA 출신인 강 과장에게 신상품 기획안을 제출하라고 지시했습니다. 약속된 두 달이 한참 지나서 강 과장이 가져온 것은 허술하기 짝이 없는 석 장짜리 보고서. 내용을 찬찬히 살펴보던 전 상무는 깜짝 놀랐습니다. 대부분 작년 본사 마케팅 회의에서 기각됐던 내용을 그대로 재활용한 것이었기 때문입니다. 강 과장을 다그치자 돌아온 답은 현재 사업 중인 신사업 부문의 전체적인 시장규모를 정확히 알 길이 없고, 인접한 사업 영역도 어떻게 구성되는지 파악하기 힘드니 새로운 사업 아이디어를 내기가 어려운 건 당연하다는 논리였습니다. 그나마 영업사원들이 대리점들로부터 들은 풍문들을 바탕으로 시장을 분석하고 사업 기획안을 구성한 뒤, 인터넷 검색으로 찾은 데이터로 채워 넣은 그 보고서가 최선이란 항변이었습니다. 제너럴일렉트릭(GE)의 경우 2000년대 초반까지만 하더라도 전문 마케팅 조직을 두지 않았습니다. 일례로 항공기 엔진을 제조하는 GE에이비에이션의 경우 주요 경쟁사가 롤스로이스와 프랫앤드휘트니의 2개 회사뿐이었던 터라 마케팅 조사 같은 것은 필요 없다고 생각했습니다. 그러나 시장이 점차 성숙화하면서 GE 경영진은 급격한 유가 변동, 항공 수요 감소, 규제 강화 등 산업환경 변화에 대해 경영진 수준에서 명확하게 이해할 필요가 있다는 점을 깨달았습니다."

1. 마케팅 조사란 무엇인가?

도입 사례를 통하여 기업이 어떤 활동을 효과적으로 수행하기 위해서는 마케팅 조사가 반드시 수행되어야 할 과정임을 확인할 수 있었고, 그 중요성 역시 점차 강조되고 있음을 알 수 있었습니다. 그렇다면 마케팅 조사란 무엇일까요? 마케팅 조사는 오늘날 대부분의 소비자들에게 그리 낯설지 않는 단어입니다. 많은 사람들이 시장 조사 혹은 설문지와 같은 것을 손쉽게 연상하고는 있지만 무엇이 마케팅 조사인지에 관해서는 이해가 부족한 상태입니다. 그러므로 마케팅 조사에 대하여 바른 이해를 하는 것이 SPSS를 활용한 리서치의 첫 출발점이 되어야 할 것입니다.

마케팅조사란 마케팅 의사결정을 의한 실행가능한 정보의 제공을 목적으로 자료를 체계적으로 획득, 분석, 해석하고 보고하는 객관적, 공식적인 프로세스로 정의될 수 있습니다. 이를 보다 상세히 설명하면 다음과 같습니다.

1) 마케팅 의사결정 : 마케팅 조사 결과를 누가 주로 활용하는가를 고려했을 때, 일차적으로 상품기획, 마케팅전략, 광고, 고객 만족 등 다양한 부서에서 활동중인 마케터들이 마케팅 정보의 주된 소비자들이며, 이들이 보다 효과적인 의사결정을 하도록 지원해야 한다는 의미입니다. 마케팅 조사는 시장의 과거와 현재를 분석하고 미래를 예측하는 활동으로서, 반드시 마케팅 의사결정자가 당면한 문제 헤결에 도움을 주어야 한다는 의미입니다.

2) 실행가능한 정보의 제공 : 마케팅 조사의 최종 목표가 단지 통계나 자료의 제공이 아니고, 이를 가공한 의미있는 정보가 되어야 한다는 것을 의미합니다. 즉 시장에서 밝혀낸 사실들을 바탕으로 마케터의 직관과 경험이 결부됨으로서 실제 마케팅 프로그램에 반영이 되어야 함을 의미합니다.

3) 자료를 체계적으로 획득, 분석, 해석하고 보고 : 마케팅 조사가 단순히 설문지나 인터뷰를 통해서 질문하고 응답을 받아내어 기록하는 것 이외에 고도의 분석 및 해석과정이 포함되어야 하며, 기업 임직원 등 보다 상위의 의사결정자에게 보고됨으로서 기업이 시장지향적으로 운영될 수 있도록 해야 한다는 의미입니다. 다시 언급되겠지만, 마케팅 조사에 있어서 수집된 데이타를 정보로 요약, 가공하는 과정의 중요성은 점차 증대하고 있는 실정입니다.

4) 객관적, 공식적 과정 : 마케팅 조사가 조사와 무관한 의도나 목적을 합당화하기 위하여 조작되거나 편향되어서는 안되며, 신뢰성과 타당성을 확보해야 한다는 것을 의미합니다. 만일 객관성을 잃는다면, 데이타의 존재 가치가 무용해지며, 주관적인 의사결정과 아무런 차이가 없을 것입니다. 또한 공식적 과정이라는 것은 마케팅조사 프로세스가 명확히 사전에 규정되고 설정되어 통일성과 일관성을 확보해야 한다는 것을 의미합니다. 따라서 마케팅 조사는 사전에 철저히 준비된 조사 계획과 가이드라인에 따라서 체계적이고 과학적인 프로세스를 통하여 이루어져야 할 것입니다.

2. SPSS 개요

이런 과학적이고 체계적인 마케팅 조사를 도와주는 필수적 소프트웨어가 바로 SPSS입니다. 본격적으로 시작하기 전에, SPSS란 무엇인가에 대하여 간단히 살펴보도록 하겠습니다. 오늘날 많은 분들이 통계를 어려워하십니다. 통계하면 복잡한 수식과 숫자들이 먼저 떠오르기 때문이지요. 이처럼 과거 시장조사와 통계처리는 고도의 숙련된 통계 전문가와 더불어 값비싼 메인 프레임급 컴퓨터를 이용하여 이루어져오던 고도의 전문화된 영역이었습니다. 그러나 최근 급속하게 발전된 컴퓨터의 사양과 성능은 통계처리 방식에도 큰 변화를 불러일으키면서, 통계와 마케팅 조사라는 영역을 통계 전문가의 손에서 평범한 마케터에게로 옮겨 놓게 되었습니다. 이제 약간의 조사와 컴퓨터 관련된 지식만 있다면 누구나 손쉽게 필요한 통계 분석을 할 수 있는 시대가 도래하였습니다.

이런 변화의 중심 속에는 오랜 세월동안 마케터들에게 애용되어오면서 발전을 거듭해온 SPSS라는 통계처리 소프트웨어 프로그램이 있었습니다. SPSSStatistical Package for the Social Science의 약자로서, 사회과학을 위해 개발된 통계 패키지 프로그램을 의미합니다. 경영학은 물론이고 심리학, 사회학, 교육학, 신문방송학 등 사회과학의 제 분야에서 핵심적으로 이용되고 있는 통계 프로그램 입니다.

이와 유사한 프로그램들로 SASMinitab, r 등 다른 통계 프로그램들이 더러 있지만, SPSS80년대말부터 이미 DOS 프로그램용으로 개발되어 사용되어왔으며, 1993년 최초로 윈도우용 버전인 SPSS 5.0이 출시된 이후로 가장 표준적인 통계 패키지로 빠르게 자리잡았습니다. 최근에도 SPSS는 거의 매년 버전 업그래이드를 하면서 빠르게 변화하고 있습니다. 그 결과 인터넷이나 자료실 등에서 구할 수 있는 SPSS 평가판의 버전은 낮은 버전으로는 SPSS 12에서 높게는 SPSS 21 등 다양한 버전들이 있으며, 한글판과 영문판 등 다양한 언어로도 선택적으로 배포받을 수 있습니다.

최근 r이 무료 오픈소스라는 장점과 다양한 적용성으로 큰 인기를 끌고 있습니다. 분명히 r은 매우 훌륭하고 미래가 밝은 통계 프로그램입니다. 그러나, 여전히 사용성이나 편리성 측면에서는 개선 소지가 많고, 코딩을 익혀야 하는 등 배우는 과정에 시간과 노력이 많이 소요됩니다. 어떤 통계 툴을 써도 통계 결과가 크게 다르게 나올리는 없습니다. 자신에 맞는 툴을 사용하시면 됩니다. 개인적으로 r은 빅 데이타 처리, 비쥬얼라이제이션에 강점이 크고, spss는 표준 도구로서 어느 목적에도 사용이 가능한 다목적이라고 생각됩니다.

본 콘텐츠는 다양한 통계 도구 중에서도 현재 손쉽게 구할 수 있고 비교적 프로그램 버그 등이 제거되어 안정적인 SPSS 한글판을 기준으로 강의가 진행될 예정입니다. 그러나 혹시 수강생 여러분들이 다른 버전, 혹은 영문판 등 다른 버전의 SPSS를 가지고 있다고 하더라도 기본적인 수강이나 학습에 큰 문제는 없으리라 생각됩니다. 본 교과목에서 다루고자 하는 기본적인 분석 메뉴는 모든 버전에 동일하게 들어가 있으며, 단지 메뉴의 위치나 프로그램 대화 창의 인터페이스 디자인들만이 살짝 다른 정도이기 때문에 수강에 지장은 없으리라 판단됩니다. 또한 어떤 버전을 사용하더라도 SPSS 프로그램이 분석 후 제공하는 결과 값은 아무런 차이가 없습니다.

3. SPSS를 운영하기 위한 컴퓨터 환경

최근 컴퓨터 하드웨어의 성능이 소프트웨어의 성능을 뛰어넘은지 오래되었기 때문에 SPSS를 운영하기 위한 별도의 PC 성능에 대한 고려는 그다지 중요하지 않을 것이라고 생각됩니다. 사실상 현재 운영되고 있는 거의 모든 PC에서 SPSS는 안정적으로 설치되고 작동합니다. 실제로 마이크로소프트 오피스가 운용될만한 수준의 PC 환경이라면 SPSS는 무난한 성능을 보여줄 것입니다그러나, 오랜 시간 SPSS를 사용해본 경험을 바탕으로 몇 가지 권장 사항을 정리하면 다음과 같습니다.

첫째,  SPSS는 윈도우 환경에서 최적 작동합니다. 애플 매킨토시 버전의 SPSS도 출시되기 시작했지만, 이를 안정적으로 사용하기 위해서는 윈도우 XP이상의 환경이 필요합니다.

둘째, 램은 1기가 이상이면 무리가 없이 작동합니다. 다만, 처리해야 되는 데이타의 양이 기하급수적으로 증가하는 경우, 램의 크기와 성능에 따라 계산 속도가 증가하기 때문에 램은 다소 여유가 있는 것이 좋습니다.

셋째, 특히 본 과정에는 큰 모니터 화면 사이즈가 편리함을 제공할 수 있습니다. 본 교과목의 사어버 강좌를 띄어놓고, 동시에 SPSS 프로그램을 실행하면서 따라해야할 경우가 많기 때문에 가능하면 넓은 화면이 보다 편리할 것입니다.

그러나 위에서 말씀드린 SPSS를 운영하기 위한 최적 환경이 아닐지라도, 소형 노트북의 작은 화면에서도 SPSS는 여러분의 PC에서 큰 문제없이 잘 작동되기 때문에 컴퓨터 환경으로 인한 큰 장애는 없을 것으로 생각됩니다.

4. SPSS의 설치

이제 실제로 수업을 진행하기 이전에 여러분의 PC에 직접 SPSS 프로그램을 설치해볼 차례입니다. 여러분이 설치해야되는 SPSS 프로그램은 고가의 상용 프로그램이므로 본 강좌에서 설치용 파일을 제공하지는 않습니다. 여러분이 직접 개별적으로 구매해서 설치하거나, 혹은 일정한 정해진 기간에 한해서 사용이 가능한 체험판을 구해서 직접 설치하여야 합니다. 그러나 뛰어난 성능에 걸맞게 SPSS 프로그램의 가격은 매우 비싼 편이기 때문에 대부분 프로그램을 직접 구매하기 보다는 수업을 위하여 체험판을 설치하게 될 것입니다.

체험판을 구하기 위하여 네이버나 다음 등을 검색하게 되면 SPSS 12.0부터 최근 버전까지 다양한 버전들의 체험판을 다운로드 받을 수 있습니다. 그러나 최신 버전을 다운로드 받고, 프로그램에 관련된 추가적인 정보등을 얻기 위해서는 SPSS의 공식 홈페이지를 방문할 것을 권합니다. SPSS의 한국내 홈페이지 주소는 www.spss.co.kr 입니다.

<SPSS 홈페이지>

자 이제 SPSS 홈페이지를 방문하셨으면, 회원 가입후 최신 SPSS 프로그램의 평가판을 다운로드 받아봅시다. 다운로드 받기 위해서는 화면 상단의 바로가기 메뉴 중 제품을 클릭한 후에, 화면 우하단에 평가판 다운로드 바로가기 배너를 클릭하면 됩니다. 설치 방법은 다른 일반적인 프로그램들과 마찬가지로, 라이센스 계약을 읽은 후 화면이 제시하는 순서에 따라 설치를 하시면 큰 어려움 없이 설치가 가능합니다. 직접 다운로드 후 해당 프로그램을 여러분의 PC에 설치해 보시기 바랍니다.

이제 설치가 완료되었는지요? 설치가 완료된 이후에는 찬찬히 SPSS사의 홈페이지에는 어떤 정보들이 들어있는지 둘러보는 것도 좋을 것 같습니다.

우선 SPSS 홈페이지에서는 SPSS 프로그램과 관련된 다양한 도서와 프로그램 매뉴얼을 구입할 수가 있습니다. 여기서 판매되는 책들은 심도있는 통계적 지식들을 다루고 있지는 않지만 프로그램 이용법 위주의 간단한 개요서들로서 프로그램과 친숙해지는데 도움을 줍니다.

또한 자료실로 가면 SPSS를 활용하여 작성된 논문이나 보고서, 설문지, SPSS 데이타 파일 등의 예를 다운로드 받아 볼 수 있으며, Q&A 형태로 프로그램에 대한 질문 등을 주고 받을 수 있는 공간들이 있습니다. 앞으로 필요한 정보들이 있을 때 SPSS 웹 사이트를 많이 활용해 보시기 바랍니다.

: 청주대학교 이 원준(meetme77@naver.com)

728x90

+ Recent posts