데이터는 어떤 스토리를 담고 있는가?
지난 데이터 연재 시리즈 1편 에서는 데이터의 중요성과 사회 데이터의 개념에 대해 소개해드렸습니다. 데이터는 이야기에 객관성과 신뢰도를 높여주고, 또 사회 데이터는 집단행동 패턴을 이해할 수 있는 증거가 된다는 내용이었습니다.
+ [1편] 데이터는 스토리를 담고 있다(기사 자세히 보기)
이번 2편에서는 데이터와 그래프를 통해 어떤 이야기를 전개할 수 있을지 살펴보도록 하겠습니다. 아래 그래프는 시중 두 카드 회사 사용자들이 2019년 12월 한 달 동안 헬스, 요가, 종합 스포츠 등 스포츠 센터에서 카드를 사용해 결제 승인된 데이터를 간단한 기술 통계로 분석 후 시각화 한 것입니다. (참고: 결제 지역이 아닌 카드를 사용한 카드 소지자의 거주지 기준)
물론 운동 시설에서 사용한 카드 결제 내역으로 실제 사람들이 운동을 했는지, 얼마나 하는지 바로 알 수는 없습니다. 하지만 사람들의 결제 행위를 운동에 대한 니즈 표현이라고 가정한다면 우리는 아래 그래프에서 어떤 사실들을 알아낼 수 있을까요?
첫째, 남녀 모두 운동 시설에서 소비 빈도가 높은 연령대 즉, 돈을 주로 쓰는 인구 연령은 40~54세이며, 남자들이 좀 더 자주 지갑을 열고 있습니다. 둘째, 남녀 모두 35~39세부터 운동에 관심을 갖고 운동시설에 돈을 지불하는 빈도가 증가했습니다. 셋째, 소비 빈도는 낮지만 25~30세 여성들이 1회 결제 금액은 20만 원대로 다른 인구 유형에 비해 월등히 높습니다.(데이터 자세히 보기)
전국(왼쪽)과 서울특별시(오른쪽) 전 연령·남녀 헬스,요가,종합스포츠 소비 빈도 및 1회 사용 금액이번에는 동일한 데이터를 지역별로 분석한 그래프를 살펴보겠습니다. 운동 시설에서의 소비 규모가 가장 큰 지역은 서울입니다. 2개 카드 회사 데이터라는 점을 고려해도 지역별 주민등록 인구가 서울의 약 1.3배인 경기도보다 서울 지역이 소비 파워가 높습니다. 서울특별시 중에서 동작구, 강남구, 마포구에 거주하는 사람들의 소비 금액이 큽니다.
+ 전국 데이터 자세히 보기
+ 서울특별시 데이터 자세히 보기
이렇듯 동일 데이터라 해도 활용하는 목적과 상황에 따라 정보가 보여주는 사실을 여러 방향으로 엮으면 매우 다양한 스토리가 나올 수 있습니다. 하지만 데이터에서 누가(who), 무엇을(what), 언제(when), 어디에서(where)에 대한 기본 정보를 얻고 여기에 왜(why)라는 질문에 답할 수 있는 해석이 추가되면 하나의 스토리를 완성할 수도 있습니다.
데이터가 보여주는 의미를 따라가다 보면 자연스럽게 연관 질문이 생기고, 또 그 질문에 답할 수 있는 다른 데이터가 조합되면 스토리가 풍부해질 수도 있습니다. 그렇다면 이런 데이터는 어디에서 얻을 수 있을까요? 바로, 서치스(searcheese)가 제공하는 데이터 포털 인스파일러(INSFILER)를 통해 얻을 수 있습니다.
서치스는 삼성SDS의 사내 벤처 발굴 프로그램인 XEED-LAB(씨드랩)*을 통해 삼성SDS에서 분사 후 2019년 1월 설립된 회사입니다. ‘모두를 위한 데이터 서비스 채널’을 표방하고 있으며, 많은 사람들이 더 많은 인사이트와 기회를 발견할 수 있도록 쉽고 간편한 데이터 사용 환경을 제공합니다.
서치스가 제공하는 데이터 플랫폼이 인스파일러입니다. 인스파일러는 데이터 분석에 필요한 인프라와 비용에 대한 부담 없이 누구나 쉽게 다양한 데이터를 탐색해 볼 수 있는 데이터 검색 포털입니다. 알고 싶은 성별, 연령, 지역을 선택하면 프로파일 자료를 볼 수 있으며, 인구 유형을 기준으로 생활 습관과 소비 성향, 문화, 여가 등도 데이터를 통해 확인할 수 있습니다.
+ 인스파일러 서비스 이용하기
※ XEED-LAB 이란?
씨드랩은 다음 세대를 의미하는 알파벳 X와 신사업을 발굴하고 육성한다는 의미를 담은 시드(seed)의 합성어로 삼성SDS가 임직원에게 공모 받아 신사업 아이디어를 발굴하고 사업화하는 사내 벤처 프로그램입니다.