728x90

1. 데이터 파일 생성

SPSS에서 처리할 데이터를 작성하기 위한 방식은 크게 3가지 방식을 사용할 수 있습니다. 첫째 아래한글이나 텍스트 편집기를 이용하여 입력을 받거나, 둘째 엑셀로 준비한 파일을 입력받을 수 있습니다. 그리고 셋째 바로 SPSS의 데이터보기 창에서 직접 데이터를 입력하여 데이터 파일을 만들 수도 있습니다. 세가지 방법 모두 사용 가능하지만,, 보통 사용 목적에 따라 적합한 방식이 있으므로 필요에 따라 선택하여 사용하면 됩니다.

세 가지 문항으로 이루어진 간단한 설문자료를 이용하여 데이터 파일을 생성하는 법을 배워보겠습니다.

문항 1. 당신이 좋아하는 과목은 다음중 무엇입니까?

1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다 ________

문항 3. 당신의 성별은 무엇입니까?

1) 남성 2) 여성

1) 아래한글 혹은 텍스트 입력기를 활용하는 방법

일반적으로 표본의 수가 매우 큰 조사 자료를 입력하는 경우 아래한글 같은 워드프로세서를 입력하여 txtASCII 파일 형태로 자료를 일괄적으로 입력하는 것이 편리합니다. 엑셀이나 SPSS 데이타보기 창에 비하여 이런 워드 프로세서들은 대용량 파일을 빠르게 처리할 수 있기 때문입니다. 간단히 10명의 응답자가 설문에 응답한 예를 들어보면 아래와 같이 설문지의 데이터를 고정 형태로 입력할 수 있을 것입니다.

설문지에 응답한 내용을 아래한글에 옮길 때 주의사항은 미리 각 변수의 자리 수를 생각해두어야 한다는 점입니다. 위 데이타의 첫 번째 응답자를 보면 ‘1 852’로 코딩되어 있습니다. 1은 첫번째 변수인 좋아하는 과목(수학)’이고, ‘85’점수’, 2성별(여성)’입니다. 85앞에 한 칸이 공란으로 띄어져 있는 이유는 점수는 최대 허용 가능한 점수가 100점으로서 최대 3칸의 자릿 수를 차지하기 때문에 100점 맞는 응답자를 대비해서 공간을 맞추어 놓은 것입니다. 본 데이타의 10번째 응답자를 보면 실제로 100점을 맞아 자리 수가 꽉 차 있음을 볼 수 있습니다.

다음 단계로는 이 파일을 아래 한글에서 새로운 이름으로 저장하면서, 파일 형식을 hwp가 아니라 txt로 저장하시면 SPSS에서 불러올 수 있습니다.

SPSS에서는 txt 파일도 다양한 형태로 불러 올 수 있지만, 가장 빈번하게 사용되는 방식을 위주로 설명드리겠습니다. 이제 SPSS를 열고 파일 -> 열기 -> 데이타열기 메뉴를 차례로 클릭하시면 아래와 같은 메뉴가 나옵니다. 이 데이터열기 창에서 저장해놓은 txt 파일을 열어 보겠습니다.

파일을 열면 자동적으로 텍스트 가져오기 마법사가 시행되는데, 우선 텍스트 1단계에서는 텍스트 파일이 사전에 정의된 형식과 일치하는지 확인합니다. 사전에 형식을 정의한 것이 없으므로 아니오를 선택합니다.

그리고 다음 단계로 넘어가면 txt 파일의 데이타가 구분자에 구분되어 있는지 고정 너비인지 묻는 질문이 나옵니다. 각 변수간 구분을 쉼표나 마침 표등 구분자로 하였을 경우에는 구분자에 의한 배열을 선택하지만, 보통 이렇게 하지 않습니다. 쉼표와 같은 구분자를 일일이 변수 사이에 입력하는 경우에는 그 수고가 적지 않기 때문에 보통 위에서 예를 든 것처럼 공간을 일정하게 배분하여 입력을 하게 됩니다.. 이런 경우 마법사 창에서 고정 너비로 배열을 선택하게 됩니다. 아울러 본 텍스트 파일에는 변수 이름이 포함되어 있지 않으므로 변수 이름이 파일의 처음에 있는지 묻는 질문에는 아니오를 선택하면 됩니다.

그 다음에도 몇 가지 단계가 남아 있지만 중요한 사항들은 아니므로 무시하고 계속해서 다음을 누르시면 4단계로 갑니다. 4단계에서는 읽어온 데이터의 자릿수를 구분해서 나눔으로써 변수의 개수를 지정하게 됩니다. 변수를 지정하는 방법은 박스 하단에 있는 데이타에 가서 각 변수에 해당하는 자리에서 마우스를 오른 클릭하면 변수 구분선이 자동 생성됩니다.. 이때 사전에 지정된 변수의 자릿수에 맞게 구분선을 클릭하시면 원하는 변수들을 얻을 수 있습니다. 구분선이 잘못되었을 경우에는 구분 삭제버튼을 누르셔서 취소할 수 있습니다.

완료하시면 이제 아래와 같이 SPSS의 데이타보기 창에 데이터 입력이 자동으로 완성된 것을 볼 수 있습니다. 이를 SPSS상에서에서 다른 이름으로 저장하여 SPSS만의 고유한 확장자인 data.sav로 다시 저장하시면 데이타 불러오기가 완료됩니다.

2) 엑셀을 활용하는 방법

최근에는 보다 보편적으로 엑셀을 활용하여 데이터 파일을 작성한 후 SPSS에서 읽어들이는 방법이 보다 많이 사용되고 있습니다. 그 이유는 우선 엑셀의 경우 엑셀의 열(칼럼) 하나가 하나의 변수에 해당되기 때문에 초보자가 입력 실수를 할 가능성이 아래한글을 이용한 경우보다 적다는 점입니다. 그리고 또다른 이유로 구글이나 인터넷을 활용하여 설문을 실시할 경우 이런 프로그램들은 기본적으로 설문 응답 결과를 엑셀 파일 형태로 저장해주기 때문에 매우 편리하기 때문입니다.

엑셀을 이용하는 경우 엑셀 한 개의 열이 SPSS에서 한개의 변수로 자동적으로 인식됩니다. 즉 아래와 같이 설문 응답한 데이터를 엑셀 차트에 저장한 이후에 data.xls 파일로 저장하면 됩니다. 아래의 엑셀 챠트를 살펴보면 10개의 응답자가 응답한 설문 결과 외에 맨 첫 번째 줄에 a1, a2, a3의 추가된 데이타가 있는 것을 볼 수 있습니다. 엑셀로 저장된 데이타를 불러올 때는 선택적으로 엑셀의 맨 첫 줄에 있는 내용을 변수 명으로 지정하여 불러들일 수 있습니다. 즉 이 엑셀 파일을 SPSS로 불러들이면 SPSS는 자동적으로 a1, a2, a3라는 이름을 가진 세개 변수를 자동으로 만들 것입니다.

이제 SPSS를 열고 파일 -> 열기 -> 데이타열기 메뉴를 차례로 클릭하시면 아래와 같은 메뉴가 나옵니다. 파일 유형을 xls로 변경하신 후 데이터 파일을 열 수 있습니다.

이때, ‘첫행에서 변수 이름 읽기옵션을 선택하시면 엑셀의 첫 줄에 있는 데이터는 데이터가 아니라 변수 이름으로 읽힐 것입니다. 이 과정을 거치면 SPSS의 데이타보기 창에 데이터 입력이 완성된 것을 볼 수 있습니다.

3) SPSS를 활용하는 방법

SPSS데이타보기창을 엑셀 창처럼 활용해서 데이터를 직접 입력할 수 있습니다. SPSS의 데이타보기창의 각 셀에 직접 원하는 데이터를 입력하거나 삭제할 수 있습니다. 이 방법은 가장 간단한 방법이지만, SPSS의 데이타데이터 입력 속도가 아래 한글이나 엑셀에 비하여 현저하게 느리기 때문에 많은 양의 데이터를 처리할 때는 적합하지 않습니다. 다만, 기존의 데이타에 내용을 변경하거나 일부 추가할 때는 유용하게 사용될 수 있습니다.

또한 각 열의 이름인 변수 명이나 각 행의 번호에서 마우스를 오른 클릭하면 특정 열이나 줄을 삽입하거나 삭제할 수 있으며, 정렬할 수 있는 메뉴가 나타납니다. 이를 이용하여 데이터를 정리하는 것도 가능합니다.

2. 변수의 정의

SPSS데이타 보기창은 엑셀과 마찬가지로 데이터 파일을 수정하거나 편집하는 데 있어서 편리합니다. 데이타 보기창은 크게 3가지로 구성되어 있습니다.

1) (row) : 각 행은 설문에 응답한 개인을 나타냅니다. 일예로 100명이 응답한 경우 기본적으로 100개의 행이 생성됩니다.

2) (column) : 각 열은 변수를 나타냅니다. 설문지 문항에 10개의 변수가 있는 경우 기본적으로 10개의 열이 생성됩니다.

3) (cell)“ 각 설문 응답자들이 응답한 변수의 값을 의미합니다.

 

 

SPSS를 이용하여 분석하기 이전에 각 변수들은 변수의 이름(변수명), 데이터의 형식, 변수의 속성, 속성 값 들이 정의될 필요가 있습니다. 변수와 관련된 이런 작업들은 메뉴 창의 데이터-> 변수특성 정의를 선택하는 방식으로 이루어질 수 있지만, 보다 직관적이고 편리한 방식으로 SPSS에서는 변수 보기탭을 별도로 제공하고 있습니다.

변수의 정의를 설명하기 위하여 다시 앞부분에서 제시되었던 설문지의 예를 들어 설명하기로 하겠습니다.

문항 1. 당신이 좋아하는 과목은 다음 중 무엇입니까?

1) 수학 2) 과학 3) 영어 4) 기타

문항 2. 당신의 평균 기말고사 점수는 몇 점입니까? 직접 입력하여 주시기 바랍니다 ________

문항 3. 당신의 성별은 무엇입니까?

1) 남성 2) 여성

위와 같은 설문지에 응답한 응답자 두 사람의 응답 값을 SPSS의 데이타보기 창에 직접 입력하였다고 합시다. 응답자1은 각각 1) 수학, 89, 1) 남성을, 응답자 22) 과학, 90, 2) 여성으로 답하였습니다. 이를 데이터 보기 창에 아래와 같이 직접 입력해 봅시다. 데이타의 입력을 완료할 경우, 문항 1)을 하나의 변수로 간주하게 되며, 문항2와 문항 3 역시 각각 하나의 변수로 정의함으로써 총 3개의 변수가 생성되게 됩니다. 변수 이름은 SPSS에서 자동으로 Var00001처럼 부여하게 됩니다.

 

그러나 자동으로 부여되는 Var00001같은 변수 이름은 자신이 보다 잘 이해할 수 있는 변수 이름으로 변경하는 것이 편리하며, 아울러 향후 분석을 위해서는 변수의 특성들을 다시 정리할 필요가 있습니다. 이런 작업들은 프로그램 하단의 ‘변수보기’ 탭을 누르면 할 수 있습니다.

‘변수 보기’.

우선 첫번째 열에는 변수 이름이 있습니다. 변수 이름은 영어 알파벳과 숫자를 조합하여 직접 입력함으로써 변경할 수 있습니다. 그외 특별한 규칙은 없지만 보통 연구자가 알아보기 쉬운 규칙을 정하여 이름을 붙이게 되며, , 한글 이름은 권장되지 않습니다. 한글SPSS 버전에는 이용이 가능하지만 영문판 SPSS에서 구현이 되지 않아 향후에 데이터를 교환하거나 공유할 때 호환성 문제가 발생되기 때문입니다.

두번째 열에는 유형이 있습니다. 데이타의 유형은 크게 여러 가지가 있습니다. 유형칸에 있는 셸을 클릭하면 선택할 수 있는 여러 가지 유형이 나타나면 자기에게 적합한 유형을 선택하면 됩니다. 이중에서 가장 빈번하게 사용되는 변수의 유형은 숫자와 문자입니다.. 숫자는 데이터 보기 탭에 있는 데이터가 아라비아 숫자로 이루어져 있을 경우 선택하게 됩니다. 이때 주의하여야 할 점은 여기서 이야기하는 숫자는 사칙연산이 가능한 숫자와 더불어 특정 이름을 지목하는 단순한 기호 형태의 숫자도 포함한다는 점입니다. 일예로, 위의 설문에서 문항 2)는 평균 점수로서 계산이 가능한 명백한 숫자이지만, 문항 1)의 경우처럼 숫자 1이 단지 특정 과목을 지칭하는 기호에 불과함에도 불과하고 여기서는 숫자로 지정해야 합니다. 즉 변수 유형에서는 단순히 데이터 보기 창에서 어떤 외형적인 형태로 데이터가 입력되어 있는지만을 기준으로 합니다. 아울러 선택할 수 있는 변수 유형중에 문자는 데이터 형태가 한글이나 영문 문자인 경우에 해당됩니다. 일예로 응답자에게 ‘Kim’이나 이 원준직접 자기 이름을 쓰도록 설문 문항이 되어 있다면 이 문항의 변수는 문자로 지정해야 할 것입니다. 그외 변수 유형은 자주 사용되지 않으므로 차차 알아보도록 합시다.

셋째 열과 넷째 열은 데이터의 크기를 지정할 수 있습니다. 즉 데이타의 자릿수와 소수점 이하 자릿수를 지정합니다. 너비가 8이라는 것은 최대 8자리까지 입력이 가능하며, 소수점 이하가 2라는 것은 소수점 둘째 자리까지 허용한다는 의미입니다. 즉 이런 경우에는 99999999.99가 최대 허용값이 될 것입니다. 다만 유형이 문자인 경우에는 다소 주의가 필요합니다. 영어 알파벳 한글자는 한 자리를 차지하지만 한글은 한 글자가 두 자리를 차지합니다. 그 결과 너비가 8로 지정된 경우 영어는 ‘abcdefgh'8글자까지만 입력이 가능하고, 한글은 가나다라4글자만 입력이 가능합니다. 더 길이가 긴 문자를 입력하기 위해서는 해당 셀을 클릭해서 원하는 크기만큼 변수의 너비를 늘리거나 줄일 수 있습니다.

다음은 다섯 번째 열의 ‘설명’ 입니다. 설명은 말 그대로 변수에 대하여 상세하게 설명을 붙일 수 있습니다. 영어와 숫자로만 구성된 변수 이름만을 보고 그 변수가 어떤 변수인지 알기는 어렵습니다. 그 결과 분석자의 이해를 돕기 위하여 설명을 첨가하게 됩니다. 변수의 의미에 대하여 자유롭게 설명을 첨가할 수 있습니다.

여섯 번째 열은 변수 값입니다. 변수 값에 대한 이해를 하기 위해서는변수변수 값의 차이를 간단히 알아야 합니다. 변수는 설문의 문항이라고 생각하시면 되고 변수 값은 문항에서 선택 가능한 혹은 입력 가능한 답변이라고 생각하시면 됩니다. , 위 설문지의 예에서 성별을 물어보는 문항 3)은 하나의 변수가 되고, 문항 3)의 보기인 1. 남자, 2. 여자는 변수 값이 됩니다. 그러나 변수 값이 각각 남자나 여자와 같은 구체적인 내용을 담고 있지만 SPSS에서는 12로만 입력이 되었습니다. 향후 분석시 분석 결과가 1, 혹은 2로 표시된다면 이것이 무슨 의미인지 파악하기가 어려울 수 있습니다. 변수 값을 붙이지 않더라도 분석은 이루어지지만, 분석 결과의 이해를 편리하기 위해서 보통 변수 값을 붙이게 됩니다.

변수 값을 지정하는 방식은 간단합니다. 변수 값에 해당되는 셸을 클릭하시면 아래와 같이 대화창이 나타납니다. 여기에 변수에 해당되는 값을 입력한 후,, 추가로 변수 값에 대한 설명을 입력하고 ‘추가’‘추가’ 버튼을 누르시면 됩니다. 모든 변수 값에 대한 입력이 완료되면 확인버튼을 누르시면 됩니다.

마지막으로 일곱 번째 열의 결측 값을 설명드리겠습니다. SPSS에서 처리가능한 결측 값은 시스템상의 결측치와 응답자의 결측 값으로 구분됩니다. 시스템 결측치는 데이타가 기록될 셀이 공백인 경우로서 보통 마침표로 표시됩니다. 그러나 응답자 결측치는 해당 문항이 누락되었음을 표시하기 위하여 어떤 특정한 값을 부여한 것입니다. 보통 9 혹은 99 등의 값을 응답자 결측치로 부여하게 됩니다. 일단 여기서 9혹은 99를 결측치로 지정하게 되면 ‘‘데이터 보기’ 창에’창에 999 같은 값이 있더라도 숫자로 인식하지 않고 무응답으로 인식하여 각종 계산에서 제외되게 될 것입니다.

: 청주대학교 이 원준 (meetme77@naver.com)

 

 

728x90

+ Recent posts