가명 데이터 결합, 어떻게 시작할 수 있나?

가명 데이터 결합, 어떻게 시작할 수 있나?

들어가며

빅데이터, AI등 다양한 융복합 산업에서의 데이터 이용 수요가 급증하는 가운데, 데이터 활용의 핵심인 가명정보 활용을 위한 법적 근거가 마련됨에 따라 이를 활용하고자 하는 기관들의 관심도 높아지고 있습니다. 그러나 가명정보도 개인정보이다보니 적극적인 활용보다는 조심스러운 마음이 앞서는 것이 기업의 현실입니다. 안전한 활용을 위한 제도 및 절차, 가이드라인이 있지만 실행에 있어서는 어려움이 있을 수 있습니다.

본 리포트는 가명결합의 전체적인 흐름과 개념이해를 돕고자 작성되었습니다. 미세한 부분이 궁금하시면 SDS결합분석센터에 연락하시거나 개인정보위원회가 발행한 가명정보처리 가이드라인을 참고하시기 바랍니다.

가명데이타를 외부 결합하기 위해서는 우선 결합신청기관 내에서 준비해야 하는 사항이 있습니다. 삼성SDS 홈페이지데이타결합분석 > 결합절차 > 가명데이타 활용준비에서 관련 프로세스를 확인해 보실 수 있습니다.

본 Report에서는 비금융사간의 데이터결합 절차를 설명하여 프로세스 기본 개념과, 각 단계별 해야 할 일을 설명하도록 하겠습니다.

결합전문기관 결합 프로세스 개요

개인정보보호법에 따르는 가명결합 프로세스에는 별도의 결합키관리기관이 있으며 ① 결합키관리기관이 제공하는 시스템을 통해 결합신청을 할 수 있습니다. 결합목적에 따라 신청기관간 결합키 값과 결합대상 데이터를 확정하고 각 행에 일련번호를 매핑합니다. ② 결합키+일련번호는 결합키관리기관에, 일련번호+결합대상정보는 결합전문기관에 보냅니다. ③ 결합키관리기관은 일련번호 연계정보를 결합전문기관에 보내고 ④ 결합전문기관은 연계정보를 기반으로 신청사의 결합대상 데이터를 결합합니다. 결합한 정보의 식별 가능 여부를 확인하여 추가가명처리 후 반출 적정성 심사를 하고 적정한 경우 ⑤반출하여 안전하게 활용합니다.

신청기관 A/신청기관 B
  • 결합대상정보 A, (결합키, 일련번호A)/ (일련번호B, 결합키), 결합대상정보 B
  • 결합키관리기관 KISA
  • (결합키, 일련번호A) -> 연계정보생성 : 일련번호A, 일련번호B <- (일련번호B, 결합키)
  • 결합키관리기관 삼성SDS
  • 결합대상정보 A, (결합키, 일련번호A) -> 결합 : 결합대상정보 A, 결합대상정보 B <- (일련번호B, 결합키), 결합대상정보 B
  • -> 추가가명처리
  • -> 반출심사
  • -> 안전한 활용

결합신청 상세절차

가명정보 결합시 수행주체별 상세절차는 아래 표와 같습니다. 표아래 부분에 예를 들어 설명하도록 하겠습니다.

절차/결합신청자/결합키관리기관/결합전문기관
  • 1,사전준비 및 결합 신청/1.결합 신청 >/ - >/ 2. 결합신청서 검토 및 접수,3.결합 일정.절차 등 협의(결합신청자)
  • 2. 결합 수행
  • 1.결합키 생성/1.결합키 생성 협의,3.결합키 및 일련번호 생성 >/2.결합키 생성 협의(Salt값 전송) > /-
  • 2.모의결합(선택)/1.결합키 전송 >/ - > /2.모의결합 가능성 검토 및 통지,3.모의결합 대상 결합키 선정 및 전송
  • 2.모의결합(선택)/4.모의결합 대상 가명처리,5.가명처리된 모의결합대상정보,가명처리내역 및 결합키 전송 >/ - > /6.가명처리 수준 검토(필요시 추가처리 요청), 7.모의결합 수행 >
  • 2.모의결합(선택)/8.모의결합된 정보 분석(결합전문기관 내), *반출 제한 >/ - >/9.모의결합 관련 정보 파기 > /-
  • 3.결합률 확인(선택)/1.결합키 및 일련번호 전송,4.결합률 확인 >/2.결합키연계정보 생성, 3.결합률 측정 및 통보 > /-
  • 4.가명정보 추출(선택)/1.결합키 및 일련번호 전송,2.추출 요청 >/3.추출 가능 여부 검토 및 통지, 4.추출에 필요한 일련번호 선정 및 전송 > /-
  • 5.가명처리 및 검토/1.결합대상정보 확정,2.가명처리, 3.가명처리된 결합대상정보, 가명처리 내역 및 일련번호 전송 >/- >/ 가명처리 지원(가능한 경우), 4.가명처리 수준 검토(필요시 추가처리 요청)
  • 6.결합/1.결합키 및 일련번호 전송 >/2.결합키연계정보 생성 및 전송, *반복결합의 경우 반복결합키 포함 > /3.결합키연계정보 수신 및 가명정보 결합, *반복결합의 경우 반복결합키 포함
  • 3. 추가처리 및 반출
  • 1.추가처리(필요시)/1. 결합된 정보의 추가처리 및 분석(결합전문기관 내), *결합전문기관에 지원 요청 가능>/- >/ *추가처리 및 분석 지원(가능한 경우)
  • 2.반출/1. 반출신청>/4.결합키 및 결합키연계정보 파기(필요시 유지*),*반복결합의 경우 결합키 생성방법(Salt).반복결합키 생성방벙(Salt)보관 >/ 2,반출심사위원회구성.운영,3.반출 승인 및 결합정보 반출, *반복결합의 경우 반복결합키 포함), 4.결합키연계정보 파기
  • 4. 활용 및 사후관리/안전성 확보 조치 이행,가명정보 처리 내역 기록.보관 >/ - >/*반출한 정보 분석 지원(가능한 경우),*개인정보 보호 교육 제공(가능한 경우)
자료 출처 : 가명정보처리 가이드라인, 2022.10.22

[1] 사전준비 및 결합신청

가명데이타 활용준비가 끝나면 외부기관과의 데이터 결합을 위해 가명정보결합종합지원시스템 (https://link.privacy.go.kr/)에 결합신청을 해야합니다. 시스템에 정보입력이 완료되면 아래와 같이 출력이 가능하며 서명 후 추가 첨부합니다. 아래 표의 ③,④번과 같이 반복결합여부와 추가절차(결합율확인, 가명정보추출, 모의결합) 신청을 할 수 있으며 ⑦번 항목의 추가서류와 사전가명처리 이행확약서, 데이타이용기관인 경우는 내부관리계획 등을 준비하여 함께 제출하여야 합니다. 신청된 자료는 결합전문기관으로 전달되며 결합전문기관 담당자는 제출문서를 검토하고 일정 등을 함께 협의하게 됩니다.

결합신청서 양식

[2] 결합수행

결합수행단계부터는 결합상황을 가정하여 설명드리도록 하겠습니다.
A호텔은 B통신사와의 결합을 통해 새로운 상품을 발굴하고자 합니다. 결합대상과 항목에 대한 확정이 되지 않아 결합신청시 결합율확인, 가명정보추출, 모의결합을 모두 진행하며 계절별 추이 확인을 위해 반복결합도 하는 것으로 신청하였습니다. (설명 편의를 위한 가정입니다.) 이 경우는 가명처리 관련 서류는 결합대상정보를 결합전문기관에 전송하는 시점에 보냅니다.

(1. 결합키 생성) A호텔담당자는 B통신사담당자와 협의하여 휴대폰번호를 결합키 생성항목으로 정하였고 암호화 방식은 SHA256(예시), 결합키관리기관 담당자로부터 Salt 값을 받아 결합키를 생성합니다.

(2. 모의결합) 결합대상항목을 선정하고자 했으나 분석에 의미있는 요소인지 또한 결합대상이 적정한지 판단이 서질 않습니다. 대량의 본결합에 앞서 결합전문기관과 모의결합을 해보기로 합니다. 결합키를 결합전문기관에 전송하면 결합전문기관은 모의결합 가능성을 검토하고 모의결합 대상 결합키를 전달합니다. 신청사는 결합대상을 추출하고 가명처리하여 결합키와 함께 결합전문기관에 전달합니다. (이때 가명처리 관련문서도 제출하여 승인을 받습니다.) 결합전문기관이 결합을 완료하면 결합전문기관이 제공하는 안전구역에서 분석을 수행하고 효과성을 확인합니다. 분석결과에 따라 대상과 항목을 확정하고 완료된 후에는 반출없이 즉시 파기합니다. (결합키관리기관 없이 결합하며 반출은 불가한 점이 본결합과의 차이점 입니다.)

(3. 결합율 확인) 결합키별로 일련번호를 매핑하고 결합키+일련번호를 가명결합종합지원시스템에 업로드 합니다. 가명결합종합지원시스템에서 제공해준 사전결합율을 확인해보니 결합율이 A호텔기준으로는 30%(10만건이라고 가정), B통신사기준으로는 5%입니다. A호텔 입장에서 결합율이 적정하다 판단되어 결합진행을 결정합니다.

(4. 가명정보 추출) 가명정보추출이 신청됨에 따라 결합키관리기관은 추출 가능여부를 우선 확인 후 결합건+잡음(결합건수의 100%, 신청사가 개별고객 결합여부 확인불가)건을 합한 총 20만건을 신청기관에 전달합니다. 신청기관인 A호텔과 B통신사는 대상을 받아 가명처리를 진행합니다. B통신사 입장에서는 애초에 200만건을 가명처리해야 했으나 20만건만 가명처리하여 결합전문기관에 전송하면 되므로 많은 시간과 자원이 절감됩니다.

(5. 가명처리 및 검토) 결합대상 항목정보가 확정되면 신청사 내부 절차에 따라 가명처리를 수행하고 일련번호+결합대상정보를 결합전문기관에 전달합니다.신청시 제출하지 못한 가명처리관련 문서도 함께 제출하며 결합전문기관은 적정하게 가명처리 되었는지 확인하고 사전가명처리수행 확약서를 받습니다. (데이터 전달방법은 결합전문기관이 가이드합니다.)

(6. 결합) 결합키관리기관은 최종 수신한 결합키+일련번호로 결합키연계정보를 생성하여 결합전문기관에 전달합니다. 결합신청서에 반복적 결합을 신청하였으므로 반복결합키도 포함하여 전달합니다. 결합전문기관은 연계정보를 기준으로 결합대상정보를 결합하고 반복결합키도 결합정보에 붙여줍니다.

[3] 추가처리 및 반출

(1. 추가처리) 신청사는 결합전문기관에 직접 방문하여 결합결과물을 확인하고 결합으로 인한 식별가능 위험요소가 있다면 추가가명처리를 수행합니다. 가명처리 경험이나 역량이 부족한 경우는 결합전문기관의 지원을 받을 수 있습니다.

(2. 반출) 신청사는 결합결과물이 재식별이 불가능하다고 판단되면 반출신청서를 제출합니다.
결합전문기관은 반출심사위원(법률검토자, 기술검토자, 보안검토자)을 구성하여 심사를 진행합니다. 심사시에는 결합신청시 제출한 자료와 이용기관의 내부관리계획, 추가가명처리를 진행한 경우 관련 내용 등을 심사위원에게 제출합니다. 심사결과 적정으로 승인되면 반출을 진행합니다. 결합키관리기관와 결합전문기관은 결합에 사용된 데이터를 모두 파기하고 기록합니다. 단, 결합키관리기관은 반복결합 요청이 있는 경우이므로 반복결합키 관련 정보는 유지합니다.

[4] 활용 및 사후관리

이용기관은 안전한 가명데이터 활용을 위해 관리적, 기술적, 물리적 보호조치를 이행해야 합니다. 개인정보 내부관리체계(가명처리부분 포함)의 내용대로 개인정보에 준하는 수준의 안전조치를 해야 합니다. 분석 조직이나 환경이 없는 경우 삼성SDS 결합분석센터를 통해서 분석을 진행 하실 수 있습니다. 상세한 내용은 가명처리 가이드라인을 참고하시거나 삼성SDS 결합분석센터에서 설명을 들으실 수 있습니다.

마치며

고객을 폭넓게 이해 할 수 있는 가장 좋은 방법 중 하나는 가명데이터 결합/분석입니다.
우리 고객이 어딜 자주 가는지, 무엇을 주로 사는지, 어떤 앱을 많이 사용하는지 등 모든 종류의 데이터를 얻을 수 있습니다. 가명결합을 통해서 고객을 깊이 있게 알아가는 여정에 참여해 보시기 바랍니다.



Reference
[1] https://www.pipc.go.kr/np/default/page.do?mCode=D040010000(가명정보처리 가이드라인)



▶   해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶   해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.

subscribe

삼성SDS 데이터결합분석센터
삼성SDS 데이터결합분석센터

dic.samsung@samsung.com