728x90

1. Jamovi 와 오픈소스 통계 패키지

1) 통계 패키지 소프트웨어

컴퓨터를 이용한 통계분석이 보편화된 이후, 주변에서 통계 소프트웨어를 사용하는 경우를 보는 것은 어려운 일이 아니다. 통계분석자들이 가장 흔하게 사용하는 통계 팩키지 프로그램은 SPSS를 필두로 SAS, Minitab 과 같은 상용 프로그램들이 있으며, 최근에는 r 등 새로운 프로그램들이 인기를 끌고 있다. 가장 잘 알려지고 보편적으로 사용중인 프로그램은 여전히 SPSS지만 각자 프로그램들은 자신의 영역에서 활약을 하고 있다. SPSS는 GUI (graphic user interfeace) 기반으로 오피스 프로그램에 익숙하다면 쉽게 조작할 수 있으며, 매년 버전 업을 통해서 방대하고 강력한 통계분석 기능을 자랑하고 있다. 최근에는 SAS나 MINITAB 등 경쟁 패키지도 점차 사용편리성 개선을 위하여 노력하고 있는 실정이다. 

그러나 이런 강점과 편리성에도 불구하고 일반인이 손쉽게 구매하기 힘든 고가의 패키지라는 것이 가장 큰 제약사항이다. 개인적 목적으로 구매할 경우 최소 수백만원을 호가하며, 기업이 구매할 경우 억 단위가 넘어간다. 또한 확장 기능을 부가할때마다 더 많은 추가 비용을 지불하여야 한다. 대부분의 대학들은 50인 내외의 소규모 라이센스 계약을 통하여 교육에 활용하고는 있지만, 대학을 벗어나는 순간 이런 고가 패키지를 이용하기는 쉽지 않다. 일반적인 중소규모의 기업은 물론이고, 대기업에서도 특별한 용도로 구매한 경우가 아닌 다음에야 현업에서 구경하기가 쉽지 않다. 여론조사나 마케팅 리서치 업체 정도에서나 갖추어놓은 경우가 많다. 전문적인 교육을 받고도 가격적 장벽으로 현업에서 사용하지 못하는 문제점들을 극복하기 위해서 누구나 무료로 사용할 수 있는 오픈소스 기반의 통계프로그램들이 등장하고 있으며, 대표적인 운동이 R project이다 (https://www.r-project.org). R은 통계 분석과 관련 그래픽 도출을 위한 완전한 무료 패키지이며, 윈도우, 맥OS, 그리고 리눅스 같은 다양한 플랫폼에서도 운영이 가능하며, 커뮤니티 중심으로 개발자들이 새로운 패키지를 계속 개발하는 유연한 프로그램 이라는 장점이 있다. 현재 2020년 기준으로 적어도 5,000개 이상의 R 패키지들이 개발되어 있다.

R이 이런 장점을 바탕으로 빅 데이터 분석 등 최근 급부상한 통계 영역에서 인기를 끌고 있지만, SPSS 등 기존 프로그램들을 충분히 대체하고 있지는 못하다. 이는 R이 GUI 형태의 소프트웨어가 아니라 일일이 code를 짜서 입력해야 하는 프로그래밍 개발 도구의 형태를 가지고 있기 때문이다. 최근에는 통합개발환경(IDE)인 'R Studio'의 이용을 통하여 다소 편리해졌다고는 하나, GUI 환경에 비할 바는 아니다. 프로그래밍 방식에 따른 개발의 유연성은 장점이 될 수 있지만, 결국 일반 사용자들에게 외면 받는 이유가 되고 있다. 과거 SPSS가 80년대까지는 지금의 r과 똑같은 프로그램 방식을 취하였지만(지금도 SPSS에서 GUI가 구현되지 않은 일부 고급분석 기능(예: conjoint 분석)을 이용하거나 맞춤형 테이블을 대량 출력할 경우에는 여전히 Syntax 코드를 짜야만 한다), 개선을 거듭하여 편리한 사용환경으로 진화한 것을 고려하면, 대중화를 위해서는 현재의 R은 편의성이 크게 부족하다. 

SPSS의 Syntax 코드

2) 오픈소스 기반 통계 패키지

이에 대한 대안으로 최근에는 무료 공개 통계프로그램들도 R과 같은 강력한 통계분석기능과 다양한 OS 플랫폼 지원의 장점은 그대로 유지하면서, SPSS 처럼 편리한 GUI를 갖추고 공개되고 있다. 이런 프로그램의 대표 주자가 PSPP, JASP, 그리고 Jamovi 이다. PSPP (https://www.gnu.org/software/pspp)는 기존에 SPSS에  익숙하였던 사용자가 SPSS를 대체하기에 적합하다. 기존 SPSS와 100% 동일한 GUI와 메뉴 체계를 가지고 있어서 아무런 추가적 학습이나 노력없이 SPSS 사용 경험을 그대로 이용할 수 있다. 당연히 무료이기 떄문에 SPSS 데모판처럼 시간 제한이나 라이센스 문제는 발생하지 않으며, 기능 역시 SPSS 확장판의 통계분석 기능 대부분을 가지고 있다. 10억개 이상의 변수나 응답자 처리가 가능한 것도 장점이다. 또한 기존 SPSS와 데이타파일의 완벽한 호환이 가능하여 과거 사용하였던 SPSS 파일을 분석하거나 타 SPSS 사용자와 데이터 교환 등이 가능하다.

SPSS와 동일한 경험을 제공하는 PSPP

또 다른 대안은 JASP (https://jasp-stats.org)나 Jamovi (https://www.jamovi.org)를 이용하는 것이다. JASP의 개발자중 일부가 독립하여 Jamovi를 개발에 참여하고 있기 때문에 이들 프로그램의 개발 철학이나 이용방식 등은 매우 유사하다. 이들 프로그램은 모두 무료 공개 프로그램이며 SPSS나 SAS와 비교해서도 더 사용하기 편리한 GUI를 갖추고 있다. 또한 이들 프로그램들은 R 통계 언어에 기반하여 구현되었기 때문에 R의 강력하고 유연한 기능을 모두 사용할 수 있다. 평소에는 GUI 형태로 통계 패키지를 이용하지만, 사용자가 R code를 직접 운용하고 싶은 경우에도 패키지 안에서 R 실행이 가능하다. 또한 비교적 개발자 커뮤니티가 작은 규모인 PSPP에 비하여 큰 규모의 R 커뮤니티가 참여하고 있기 때문에 더 빠르게 업데이트되고 더 다양한 기능 모듈들이 수시로 업데이트되고 있는 것도 큰 장점이다. SPSS 등 유명 통계 패키지와의 데이터 호환성도 갖추고 있다.

Jamovi Project

여러가지 사용 옵션이 있지만, 만일 직장에서 이미 SPSS나 SAS 등의 라이센스를 구입하였고, 많은 데이터 아카이브가 구축되어 있다면 당연히 기존 패키지를 사용하는 것이 최선일 것이다. 그러나 그렇치 않은 경우의 대안으로서 이들 공개 프로그램들은 매우 훌륭하다. SPSS에 익숙한 경험을 버리고 싶지 않은 경우에는 PSPP를, 새롭게 배우기 시작한 경우에는 JASP나 Jamovi를 선택할 수 있다. 특히 Jamovi는 SPSS를 능가할 정도의 다양한 통계 모듈들이 빠르게 추가되고 있고, R 의 확장성을 그대로 가지고 있다는 점에서 추천할 만하다. 윈도우와 맥OS, 그리고 리눅스 등 다양한 환경에서 작동되기 때문에 다양한 운영체제를 가지고 있는 학생들 대상의 교육에 있어서도 적절한 측면이 있다. 본인도 역시 고사양의 PC에는 SPSS를 운영하고 있지만, 저사양의 리눅스에서는 Jamovi를 활용하고 있다.

 

728x90

+ Recent posts