데이터는 어떤 스토리를 담고 있는가?

지난 데이터 연재 시리즈 1편 에서는 데이터의 중요성과 사회 데이터의 개념에 대해 소개해드렸습니다. 데이터는 이야기에 객관성과 신뢰도를 높여주고, 또 사회 데이터는 집단행동 패턴을 이해할 수 있는 증거가 된다는 내용이었습니다.

+ [1편] 데이터는 스토리를 담고 있다(기사 자세히 보기)

데이터는 어떤 스토리를 담고 있는가?

이번 2편에서는 데이터와 그래프를 통해 어떤 이야기를 전개할 수 있을지 살펴보도록 하겠습니다. 아래 그래프는 시중 두 카드 회사 사용자들이 2019년 12월 한 달 동안 헬스, 요가, 종합 스포츠 등 스포츠 센터에서 카드를 사용해 결제 승인된 데이터를 간단한 기술 통계로 분석 후 시각화 한 것입니다. (참고: 결제 지역이 아닌 카드를 사용한 카드 소지자의 거주지 기준)

물론 운동 시설에서 사용한 카드 결제 내역으로 실제 사람들이 운동을 했는지, 얼마나 하는지 바로 알 수는 없습니다. 하지만 사람들의 결제 행위를 운동에 대한 니즈 표현이라고 가정한다면 우리는 아래 그래프에서 어떤 사실들을 알아낼 수 있을까요?

2019년 12월 한 달 동안 헬스, 요가, 종합 스포츠 등 스포츠 센터에서 카드를 사용해 결제 승인된 데이터를 시각화 한 그래프.
최고 니즈 연령은 전국 45~49세. 남성카드 사용빈도 지수: 10,000, 여성 카드 사용 빈도 지수: 7,801, 남성 카드 사용평균 금액 지수: 2,203(49,900원), 여성 카드 사용 평균 금액 지수: 3,304(74,900원)
남성 카드 사용 빈도 지수
15-19세: 500 미만, 20-24세 : 2000미만, 25-29세: 3500미만, 30-34세 : 3000미만, 35-39세 :5000이상 , 40-44세 : 8000이상, 45-49세 : 10000, 50-54세: 9000미만, 55-59세 : 6000미만, 60-64세: 4000미만, 65-69세 : 2000이상, 70-74세: 1000이상, 75-79세 : 1000미만, 80~세 : 500미만
여성 카드 사용 빈도 지수
15-19세: 100 미만, 20-24세 : 500미만, 25-29세: 3500미만, 30-34세 : 2000미만, 35-39세 : 5000미만, 40-44세 : 7000이상, 45-49세 : 7000미만, 50-54세: 7000미만, 55-59세 : 4000미만, 60-64세: 3000미만, 65-69세 : 2000이상, 70-74세: 1000이상, 75-79세 : 1000미만, 80~세 : 500미만
남성 카드 사용 평균 금액 지수
15-19세: 1000 미만, 20-24세 : 200미만, 25-29세: 3000미만, 30-34세 : 3000이상, 35-39세 : 5000이상, 40-44세 : 8000이상, 45-49세 : 10000미만, 50-54세: 9000미만, 55-59세 : 6000미만, 60-64세: 4000미만, 65-69세 : 2000이상, 70-74세: 1000이상, 75-79세 : 1000미만, 80~세 : 500미만
여성 카드 사용 평균 금액 지수
15-19세: 500 미만, 20-24세 : 4000미만, 25-29세: 10000미만, 30-34세 : 9000이상, 35-39세 : 4000미만, 40-44세 : 3000미만, 45-49세 : 7000이상, 50-54세: 7000이하, 5-59세 : 4000미만, 60-64세: 3000미만, 65-69세 : 2000이상, 70-74세: 2000이하, 75-79세 : 1000이상, 80~세 : 2000이상 헬스, 요가, 종합 스포츠 기준 성별∙연령대로 비교한 소비 빈도 및 1회 사용 금액

첫째, 남녀 모두 운동 시설에서 소비 빈도가 높은 연령대 즉, 돈을 주로 쓰는 인구 연령은 40~54세이며, 남자들이 좀 더 자주 지갑을 열고 있습니다. 둘째, 남녀 모두 35~39세부터 운동에 관심을 갖고 운동시설에 돈을 지불하는 빈도가 증가했습니다. 셋째, 소비 빈도는 낮지만 25~30세 여성들이 1회 결제 금액은 20만 원대로 다른 인구 유형에 비해 월등히 높습니다.(데이터 자세히 보기)

지역별 소비 빈도 및 1회 사용 금액(헬스, 요가, 종합 스포츠 기준)
카드 사용 빈도 지수 (지역시도)
서울특별시 10,000, 부산광역시 4032, 대구광역시 3575, 인천광역시 658, 광주광역시 642, 대전광역시 404, 울산광역시 808, 세종특별자치시 41, 경기도 5160, 강원도 435, 충청북도 99, 충청남도 431, 전라북도 426, 전라남도 488, 경상북도 3198, 경상남도 1550, 제주특별자치도 157
카드 사용 금액 지수 (지역시도)
서울특별시 10,000, 부산광역시 1942, 대구광역시 2066, 인천광역시 627, 광주광역시 384, 대전광역시 222, 울산광역시 274, 세종특별자치시 26, 경기도 5719, 강원도 104, 충청북도 84, 충청남도 209, 전라북도 114, 전라남도 201, 경상북도 867, 경상남도 805, 제주특별자치도 247
카드 사용 빈도 지수 (지역구)
종로구 3291, 중구 987, 용산구 1146, 성동구 913, 광진구 4374, 동대문구 1316, 중랑구 1104, 성북구 6603, 강북구 5425, 도봉구 3100, 노원구 6163, 은평구 10000, 서대문구 1868, 마포구 4193, 양천구 6242, 강서구2314, 구로구 2134, 금천구 839, 영등포구 4533, 동작구 8206, 관악구 4862, 서초구 4501, 강남구 3854, 송파구 3875, 강동구 2335
카드 사용 금액 지수 (지역구)
종로구 1970, 중구 1155, 용산구 3109, 성동구 1158, 광진구 5326, 동대문구 1090, 중랑구 2960, 성북구 5137, 강북구 1738, 도봉구 1791, 노원구 6163, 은평구 7208, 서대문구 3429, 마포구 7626, 양천구 6112, 강서구 5536, 구로구 1978, 금천구 1705, 영등포구 4365, 동작구 10,000, 관악구 5338, 서초구 6847, 강남구 9206, 송파구 6128, 강동구 3569 전국(왼쪽)과 서울특별시(오른쪽) 전 연령·남녀 헬스,요가,종합스포츠 소비 빈도 및 1회 사용 금액

이번에는 동일한 데이터를 지역별로 분석한 그래프를 살펴보겠습니다. 운동 시설에서의 소비 규모가 가장 큰 지역은 서울입니다. 2개 카드 회사 데이터라는 점을 고려해도 지역별 주민등록 인구가 서울의 약 1.3배인 경기도보다 서울 지역이 소비 파워가 높습니다. 서울특별시 중에서 동작구, 강남구, 마포구에 거주하는 사람들의 소비 금액이 큽니다.

+ 전국 데이터 자세히 보기
+ 서울특별시 데이터 자세히 보기

이렇듯 동일 데이터라 해도 활용하는 목적과 상황에 따라 정보가 보여주는 사실을 여러 방향으로 엮으면 매우 다양한 스토리가 나올 수 있습니다. 하지만 데이터에서 누가(who), 무엇을(what), 언제(when), 어디에서(where)에 대한 기본 정보를 얻고 여기에 왜(why)라는 질문에 답할 수 있는 해석이 추가되면 하나의 스토리를 완성할 수도 있습니다.

데이터가 보여주는 의미를 따라가다 보면 자연스럽게 연관 질문이 생기고, 또 그 질문에 답할 수 있는 다른 데이터가 조합되면 스토리가 풍부해질 수도 있습니다. 그렇다면 이런 데이터는 어디에서 얻을 수 있을까요? 바로, 서치스(searcheese)가 제공하는 데이터 포털 인스파일러(INSFILER)를 통해 얻을 수 있습니다.

searcheese와 INSFILER 로고 삼성SDS에서 사내 벤처 발굴 프로그램을 통해 분사한 서치스

서치스는 삼성SDS의 사내 벤처 발굴 프로그램인 XEED-LAB(씨드랩)*을 통해 삼성SDS에서 분사 후 2019년 1월 설립된 회사입니다. ‘모두를 위한 데이터 서비스 채널’을 표방하고 있으며, 많은 사람들이 더 많은 인사이트와 기회를 발견할 수 있도록 쉽고 간편한 데이터 사용 환경을 제공합니다.

서치스가 제공하는 데이터 플랫폼이 인스파일러입니다. 인스파일러는 데이터 분석에 필요한 인프라와 비용에 대한 부담 없이 누구나 쉽게 다양한 데이터를 탐색해 볼 수 있는 데이터 검색 포털입니다. 알고 싶은 성별, 연령, 지역을 선택하면 프로파일 자료를 볼 수 있으며, 인구 유형을 기준으로 생활 습관과 소비 성향, 문화, 여가 등도 데이터를 통해 확인할 수 있습니다.

+ 인스파일러 서비스 이용하기

데이터 포털 인스파일러 서비스 페이지 화면 데이터 포털 인스파일러 서비스 페이지

※ XEED-LAB 이란?
씨드랩은 다음 세대를 의미하는 알파벳 X와 신사업을 발굴하고 육성한다는 의미를 담은 시드(seed)의 합성어로 삼성SDS가 임직원에게 공모 받아 신사업 아이디어를 발굴하고 사업화하는 사내 벤처 프로그램입니다.

공유하기