비 오는 수요일 많이 팔리는 메뉴는? 저희가 예측했습니다!

안녕하세요! 삼성SDS Brightics Academy 공모전에 도전해 데이터 분석 부분 대상을 수상한 ‘501호 사람들’입니다! 저희 팀은 그동안 열심히 공부한 데이터 분석 기술을 실제 회사에서 다루는 데이터에 적용해보고 싶어 공모전에 참가했습니다. 아침부터 저녁까지 공모전에 매달리느라 올여름이 더운 줄도 몰랐는데요. 이번 기사를 통해 공모전 참가 후기를 들려드리겠습니다!

10월 14일 삼성SDS Brightics Academy 공모전에서 데이터 분석 부문 대상을 차지한 <501호 사람들>10월 14일 삼성SDS Brightics Academy 공모전에서 데이터 분석 부문 대상을 차지한 <501호 사람들>

공모 주제는 데이터 사업기획데이터 분석이었으며, 저희 팀이 응모한 데이터 분석 부문은 제공되는 기본 데이터를 바탕으로 <제품 불량률>과 <취식 브랜드 수요량>을 예측하는 과제였습니다.

제품 불량률 예측은 제품을 생산하는 과정에서 발생하는 설비의 센서 측정 데이터와 해당 제품의 불량률 사이의 유의미한 연관성을 분석하고 불량률을 예측하는 과제이며, 취식 브랜드 수요량 예측은 사내 식당 취식 데이터를 활용하여 지정된 기간의 13개 브랜드의 일일 취식 수요량을 예측하는 과제였습니다.

삼성SDS Brightics Academy 공모전 포스터삼성SDS Brightics Academy 공모전 포스터

※ Brightics Academy 공모전
삼성SDS의 Brightics Studio를 통해 데이터 분석에 대한 문턱을 낮추고, 전공에 관계없이 누구나 데이터 분석을 경험해볼 수 있는 공모전

※ Brightics Studio
삼성SDS가 축적한 데이터 분석 기술을 오픈소스로 공개해 누구나 손쉽게 데이터 분석을 할 수 있도록 구성한 공개형 데이터 분석 AI 플랫폼

※ 공모 주제와 심사 내용
+ 데이터 사업기획 부문: 분석을 활용한 AI 서비스 기획 및 프로토타입
+ 데이터 분석 부문: 제시된 문제를 해결하는 가장 효율적인 알고리즘

공모전 준비하며 어려움이 많았습니다. <제품 불량률 예측> 과제를 수행 중 데이터에 이상치가 있었는데요. 계속해서 데이터 특징을 파악하고 여러 알고리즘을 변형해 접목시키며, 케이스를 나누어 분석하는 과정에 시간을 많이 쏟았습니다.

또한, <취식 브랜드 예측>은 주어진 고객 데이터에 각 고객 성별과 나이 그리고 어떤 날에 어떤 브랜드를 이용했으며 몇 개 구입했는지 정보가 나와있었는데요. 여러 고객 관련 변수를 활용해 고객들이 어떤 브랜드를 얼마큼 구입할지 예측하는 과정이 어렵기도 했지만 변수에 따라 예측률이 달라지는 과정이 재미있기도 했습니다.

7월부터 거의 매일 아침 10시에 모여 공모전을 준비하고 밤 12시에 집에 가는 일상을 보냈는데요. 삼성SDS의 Brightics Studio를 통해 쉽게 데이터를 분석할 수 있었습니다. 코딩을 잘 모르는 사람도 데이터 분석 기술을 쉽게 적용할 수 있고, 복잡한 코딩을 하지 않아도 클릭만으로 알고리즘을 쉽게 구현할 수 있기 때문인데요. 다른 툴보다 데이터 시각화에 장점이 있어 데이터 탐색 과정에서 유용하게 사용할 수 있었습니다.

삼성SDS Brightics Academy 공모전에서 데이터 분석 부문 대상을 차지한 <501호 사람들>삼성SDS Brightics Academy 공모전에서 데이터 분석 부문 대상을 차지한 <501호 사람들>

대상 수상 후 가장 많이 받았던 질문은 팀원의 전공 분야였습니다. 저희는 컴퓨터공학, 통계학, 교육학, 경영학, 경제학을 전공해 사실 인문계 전공자가 더 많은 팀인데요. 많은 분들이 컴퓨터공학, 통계학 전공자끼리 팀을 이루면 데이터 분석에 도움이 될 것이라 생각하지만, 저희 팀은 준비 과정에서 다양한 전공이 오히려 가장 큰 강점이 되었습니다. 마치 다양한 알고리즘이 결합된 앙상블 모델이 더 큰 성능을 내는 것처럼 각자 잘하는 분야가 서로 달라서 큰 시너지를 낼 수 있었습니다.

예를 들어, 통계학 전공자는 데이터 특징을 탐색해 중요 변수를 선정하는 데 강점을 보였고, 경영학, 교육학 전공자는 분석에 이야기가 있는 것을 좋아해 취식 수요량에 영향을 주는 요인을 찾아 파생 변수를 만드는 데 더 큰 역할을 했습니다. 그리고 경제학, 컴퓨터공학 전공자는 알고리즘을 변형시켜 더 좋은 성능을 얻어내는 데 더 큰 성취를 느꼈습니다.

각자 데이터를 탐색하고 알고리즘을 고안하며 떠오른 아이디어를 매주 미팅 때 공유했습니다. 이를 통해 데이터를 전처리하는 역할, 파생 변수를 여러 개 만들어 전달하는 역할, 그리고 알고리즘을 고안하여 예측 성능을 높이는 역할 등으로 세분화해 공모전을 진행했습니다.

※ 10월 14일 삼성SDS Brigtics Academy 공모전 시상식 기념 촬영을 하는 삼성SDS 윤심 CTO 부사장(앞에서 3번째 줄 가운데)과 수상자들※ 10월 14일 삼성SDS Brigtics Academy 공모전 시상식 기념 촬영을 하는 삼성SDS 윤심 CTO 부사장(앞에서 3번째 줄 가운데)과 수상자들

삼성SDS Brightics Academy 공모전을 준비하면서 이번 여름이 얼마나 더웠는지 뉴스를 통해 알 수 있었는데요. 그만큼 많은 시간을 투자하며 공모전 수상을 위해 달려왔고, 팀원 모두가 한마음으로 서로 독려해가며 처음부터 끝까지 쉬지 않고 열심히 준비했기에 좋은 결과를 얻을 수 있었습니다.

이번 삼성SDS 공모전을 통해 데이터 분석에 대한 많은 자신감이 생긴 만큼 앞으로 더 열심히 공부해 각 분야에서 뛰어난 데이터 사이언티스트로 거듭나겠습니다!

공유하기