성과를 창출하는 데이터 품질관리 - ① 데이터 품질 고도화를 위한 관리체계

성과를 창출하는 데이터 품질관리 - ① 데이터 품질 고도화를 위한 관리체계

1 데이터 품질관리 이슈

업무 자동화를 위한 애플리케이션 세분화, 모바일 디바이스와 정보시스템 간 연계 등으로 기업이 관리하는 데이터 볼륨은 매년 급속도로 증가하고 있으며, 데이터의 소스나 형태도 신기술을 반영하여 다양해지고 있습니다.

이에 따라 기업의 데이터 관리정책도 변화를 거듭하고 있습니다. 과거에는 '방대한 데이터 확보'가 우선시 되었지만, 근래 들어서는 '기업 경쟁력 강화를 위해 축적된 데이터를 어떻게 활용할 것인가'에 초점이 맞춰지고 있습니다. 기업 경영 전반에 걸쳐 데이터 활용도가 높아지면서 데이터의 정합성과 신뢰성, 즉 데이터 품질 수준이 의사결정에 영향을 끼치고 이는 곧 비즈니스 성패와 직결됩니다. 이런 이유로 최근 들어 많은 기업들이 데이터 품질관리 체계 수립과 시스템 도입에 나서고 있습니다.

데이터 품질관리 실패로 인한 저품질 데이터 유형 및 문제점 [그림 1] 데이터 품질관리 실패로 인한 저품질 데이터 유형 및 문제점

데이터 품질은 정보의 내용(데이터 값)뿐만 아니라 정보 구성의 최소 항목인 속성 및 속성 간 관계를 규정하는 데이터 구조도 함께 관리해야 합니다. 구조가 결여된 상태에서는 내용물이 담길 수 없으므로 데이터 값에 대해 최소한의 품질을 보장하기 위해서는 데이터 구조 역시 체계적으로 정의되어야 합니다.

데이터 구조가 애초에 데이터를 정확하게 담을 수 없도록 설계되어 있거나, 업무 간 또는 시스템 간 동일 데이터를 서로 다른 구조로 정의하여 관리하고 있다면, 다양한 업무나 시스템에 데이터 정합성과 신뢰성을 제공할 수 없을 것입니다. 이는 정보시스템에 상당 부분을 의존하는 현 비즈니스 환경에 다양한 문제를 발생시키는 요인으로 작용합니다.

본 백서에서는 두 가지 데이터 품질관리 사례를 소개하겠습니다. 우선 데이터 품질관리 영역에서 정보관리 최소 단위인 '속성'과 밀접히 연관되어 있는 용어 표준화 및 데이터 모델관리 사례를 살펴보고, 이어서 데이터 내용에 대한 품질지표 기반의 기준정보 품질관리 사례를 짚어보겠습니다. 이를 통해 실질적 성과를 창출하기 위한 데이터 품질관리 방안과 고려사항을 제시하고자 합니다.

2 용어 표준화와 표준 용어 기반 데이터 모델관리 사례


2.1 용어 표준화 필요성

IT 분야에서 용어라 함은 정보시스템의 화면, 프로그램, 데이터베이스 등에서 사용하는 데이터의 명칭으로 흔히 속성명 또는 필드명을 의미합니다. 기업의 경영활동 및 정보시스템에서 발생하는 데이터를 대상으로 의미와 형식, 표기방식을 전사 차원에서 표준화하여 활용한다면 시스템 통합과 정보공유 효과를 극대화할 수 있습니다. 또한, 사업수행을 위해 하나의 유기체처럼 협력해야 하는 다양한 업무 및 시스템 담당자 간의 커뮤니케이션 오류를 상당 부분 줄일 수 있습니다.

특히, 여러 시스템에서 공통으로 활용하는 데이터의 경우 시스템 간 정보 연계가 필수적이므로, 표준 용어에 기반하여 정보 항목을 정의하고 구조를 설계한다면 시스템 간 데이터 매핑이나 변환 등의 비효율적인 작업을 최소화할 수 있습니다. 아울러 업무 영역 간 또는 시스템 간 데이터 단절이나 불일치 이슈 해소에도 많은 도움이 됩니다.

이를 통해 비즈니스 변화로 인한 정보시스템 내 데이터의 변경 영향을 파악하는데 있어 신속성과 정확성을 보장받을 수 있습니다. 즉, 업무 변화에 신속 정확하게 대응 가능한 데이터 거버넌스를 갖추기 위해서는 용어 표준화가 적용된 정보시스템이 필수적입니다.

용어 표준화의 목적 [그림 2] 용어 표준화의 목적

2.2 용어 표준화 관리 대상

일상 생활에서 형식과 틀에 얽매이지 않고 자유롭게 사용하는 용어와 달리, 정보시스템에서 정의하고 활용되는 표준 용어는 DB나 애플리케이션의 오프젝트 명칭으로 사용되므로 정형화된 규칙을 통해 생성되어야 합니다. 이와 같은 이유로 표준 용어는 일반 자연어보다 단어 사용의 제약이 있을 수 있으며, 일부 생소한 명칭으로 통용되기도 합니다. 아래 몇 가지 예시를 살펴보겠습니다.

용어는 단어들의 조합을 통해서 한글과 영어로 구성한다.
   - 담보코드 = 담보 + 코드
   - Collateral Code = Collateral + Code

DB나 애플리케이션에서 사용하는 오브젝트 명칭은 단어 영문약어명의 조합으로 구성한다.
   - COLTR_CD = COLTR (Collateral) + “_” + CD (Code)

용어 구성에 사용되는 단어들은 미리 표준단어 사전에 등록한다.
   - 예시) 담보 : 채무자가 채무불이행 하는 경우를 대비해 채권의 확보를 위해 제공되는 수단영문 - Collateral, 영문약어 - COLTR

화면에서 선택 가능한 값의 목록(List of Value)을 제공하는 코드성 정보는 마지막 단어에 코드(Code, CD)를 사용한다.
   - 국가코드, 담보코드, 지불유형코드

위와 같은 규칙들을 제대로 운영하기 위해서는 아래와 같이 용어 표준화와 관련된 다양한 대상들을 관리해야 하고, 각 대상별로 별도의 운영기준을 수립해야 합니다.

대상 정의 사용 목적
단어 문법상 일정한 뜻과 구실을 가지는 말의 최소 단위. 주로 단일어를 의미하나 복합어 중 특별한 의미로 사용되는 관용어도 사용 가능 용어를 시스템에서 사용하기 위한 DB 속성명으로 전환 시 속성명을 구성하는 최소 단위
용어 업무적으로 주로 사용되는 명칭. 의미가 중복되지 않도록 구체적으로 표현하기 위해 여러 단어들을 조합하여 사용하는데, 원칙적으로 하나의 용어는 하나의 의미만을 가짐 시스템에서 용어 사용의 일관성을 보장하기 위한 필드명, 화면 라벨명 생성의 기준
코드 관련 용어 사용 시 입력 가능한 값을 모아놓은 값의 집합 화면에서 필드 값 입력 시 등록 가능한 값을 제한함
도메인
(=인포타입)
관련 용어 사용 시 사전에 데이터의 형식(Data Type)과 길이(Length) 및 소수점 자릿수를 정의한 것 용어를 시스템에서 테이블의 필드로 사용 시 입력되는 값에 대한 표준을 제시
비표준어 업무상 단어 또는 용어로 사용하기 부적합한 금칙어, 의사소통의 일관성을 해칠 우려가 있어 사용이 제한되는 이음동의어 등을 의미 비표준 단어, 용어를 사용하지 않기 위한 가이드를 제시하여 향후 점진적으로 표준 사용을 유도
[표 1] 용어 표준화 관리 대상

업종이나 각 기업별로 사용하는 단어나 업무 용어, 속성 명칭 등에 차이가 있으므로 위에 언급한 관리대상들은 지속적으로 자산화하고 공유함으로써 표준 용어의 규모와 활용도를 높여야 합니다. 자산화는 몇몇 개인이나 시스템 단위로 수행되어서는 안 되고, 전사 차원에서 각 영역 간 이견을 상시 조정하면서 표준 용어 리포지터리(Repository)에 그 결과를 관리하고 활용하는 방식이 적용되어야 합니다.

2.3 표준 용어 자산화 및 활용성 제고를 위한 관리시스템

일관된 용어 생성 규칙 적용, 전사 공유를 통한 활용성 극대화 및 표준 용어의 자산화, 애플리케이션 구축 시 용어 표준 유지 등을 위해 용어 표준 관리시스템 도입이 필요합니다. 관리시스템이나 용어 표준화를 위한 별도의 프로세스 및 운영조직 없이 개별 업무영역 혹은 단위 시스템별로 관리할 수도 있지만, 타 영역의 업무나 시스템과 연계되는 순간 더 이상 표준이 될 수 없으므로 그 효과가 극히 제한적이라 할 수 있습니다.

용어 표준 관리시스템의 일반적인 기능은 다음과 같습니다.

① 용어 표준화 관리대상 정보의 등록과 변경
  - 단어, 용어, 코드, 도메인, 비표준어 등에 대한 정보 관리 기능

② 용어 명명규칙의 자동화
  - 전사 표준으로 정의한 용어 명명규칙에 기반하여 용어 명칭을 생성

③ 정보 등록과 변경 시 거버넌스 적용
  - 업무와 시스템 경험이 풍부한 용어 관리자(데이터 아키텍트)에 의한 검토 및 승인

④ 용어 표준 준수여부 모니터링
  -전사 차원에서 활용도가 높은 주요 시스템을 대상으로 Data Dictionary를 추출하여 용어 표준, 도메인 등의 준수여부 점검
용어 표준 관리시스템 운영 모습 [그림 3] 용어 표준 관리시스템 운영 모습

2.4 표준 용어 기반 데이터 모델 관리

정보시스템 구축과 운영 과정에서 용어 표준화가 가장 빛을 발하는 영역은 DB 구축과 운영을 위한 데이터 모델링 부문입니다. 데이터 모델링은 정보의 최소 단위인 속성들로 테이블을 정의하고 테이블 간 관계를 구성하여 데이터 구조를 설계하는 것인데, 이때 자산화되어 관리 중인 표준 용어를 활용하면 전사 표준에 기반한 모델링이 가능해집니다.

주제 영역이나 테이블이 다른 경우라도 표준 용어에 기반한 속성을 활용하므로 데이터 구조의 일관성을 유지할 수 있습니다. 또한 프로세스가 바뀌어 데이터 구조 변경이 필요한 경우, 변경에 영향을 받는 테이블이나 속성 항목을 신속 정확하게 파악할 수 있습니다.

그림 4는 ERP 구축 과정에서 용어 표준과 데이터 모델 거버넌스를 하나의 시스템에 통합하여 운영한 사례를 정리한 것입니다. 차세대 ERP를 SAP 기반으로 구축하는 과정에서 다수의 레거시 시스템에도 변경이 발생하는데, 많은 프로젝트에서 정보시스템 설계자나 개발자가 임의로 데이터 오브젝트를 생성하는 경우를 볼 수 있습니다. 본 사례에서는 주먹구구식 개발을 방지하기 위해 데이터 표준 거버넌스를 데이터 표준화 시스템과 통합 적용하였습니다. 이를 통해 SAP 개발 서버에 데이터 요소(Data Element), 도메인, 도메인 코드값 등을 거버넌스 없이 임의로 생성하지 못하도록 통제하였습니다.

개발 단계 데이터 표준 거버넌스 모습 [그림 4] 개발 단계 데이터 표준 거버넌스 모습

영역별 데이터 아키텍트에 의해 승인된 오브젝트에 한해 SAP ABAP Dictionary에 자동으로 연계되도록 구축되었고, 또한 주기적으로 SAP 개발서버에 생성된 데이터 오브젝트와 표준 용어 간 일치성 검증작업도 수행하였습니다.

① 용어 표준 거버넌스
ㆍ 영역별 검토자의 용어 승인 완료 시 SAP ABAP Dictionary에 데이터 요소, 도메인, 도메인의 Value List를 자동으로 생성하여 설계자/개발자에 의한 임의적인 용어 생성 방지
ㆍ 주기적으로 SAP ABAP Dictionary 정보를 추출하여 용어 표준과 비교 검증하고 표준 위반 시 가이드

② 데이터 모델 거버넌스
ㆍ SAP의 CBO 테이블 설계 시 활용한 데이터 모델링 툴에 용어 표준을 Import
ㆍ 설계자에게 테이블 필드 정의 시 Import된 용어 표준만 활용하도록 가이드
ㆍ 데이터 모델 리포지토리에서 업로드된 테이블과 필드 정보 추출하여 데이터표준화 시스템에 Import
ㆍ 표준 용어를 준수하여 설계된 테이블에 한해 데이터 표준 시스템에서 검토 요청 가능
ㆍ 영역별 데이터 아키텍트가 검토하여 승인된 테이블에 한하여 SAP 개발서버에 활성화 가능하며, 활성화 이전에는 해당 오브젝트를 사용하는 애플리케이션 개발 불가

2.5 표준 용어 거버넌스 운영 시 고려사항

용어 표준 및 데이터 모델 거버넌스를 정보시스템 구축 단계에 적용하는 과정에서 발생하는 시행착오를 최소화하기 위해 아래 사항을 고려해야 합니다.

① 용어 표준 적용 대상 시스템을 선별해야 합니다.
모든 시스템을 대상으로 적용하는 것은 비용 대비 효과 측면에서 비효율적입니다. 사용자가 많고 여러 프로세스와 업무에서 사용하는 시스템을 대상으로 적용해야 하는데, 가장 효과적인 대상은 ERP나 기간계와 같이 전사 프로세스에서 다수 활용하는 시스템입니다. 특히, 차세대 시스템 구축 시 적용하면 최대의 효과를 볼 수 있습니다.
용어 표준이나 데이터 모델은 시스템 구축 단계에서는 많은 효과를 거둘 수 있지만, 운영 중인 시스템의 경우 DB나 애플리케이션에 대규모 변경을 발생시키기 때문에 적용 여부를 최대한 신중하게 결정해야 합니다. 다만, 기존 시스템이더라도 신규 개발 영역에 부분적으로 적용하는 것은 가능할 것입니다.

② 전사 차원의 데이터 관리 조직 운영은 선택이 아닌 필수입니다.
표준화 원칙과 세부 규칙 정의, 데이터 표준 유지 등을 위해 상시적으로 가이드하고 모니터링할 수 있는 담당자와 조직이 필요합니다. 이러한 데이터 표준은 업무, 프로세스, 시스템에 공통으로 적용되어야 하기 때문에 전사 조직으로 구성해야 합니다.

③ 조직에는 경험과 지식이 많은 데이터 아키텍트가 구성원으로 포함되어야 합니다.
일례로 용어 관리 시스템에 신청된 용어를 면밀히 검토하지 않고 곧바로 승인한다면, 중복 용어나 유사 용어가 무차별적으로 생성될 수 있습니다. 이는 시스템 기능으로만 통제할 수 없고 데이터 표준 관리자의 경험과 지식으로 해결할 수 있습니다. 즉, 데이터 표준화 및 모델링 경험이 많은 데이터 아키텍트를 중심으로 조직을 구성해야 합니다.

④ 정보시스템 설계자와 개발자에 대한 지원과 변화관리가 필요합니다.
어떤 영역의 표준화 과제라도 초기에는 많은 시행착오를 거치게 되며, 표준화가 안착하기까지는 지속적인 가이드와 모니터링이 필요합니다. 특히, 촉박한 개발 일정때문에 생산성을 중요시 할 수 밖에 없는 설계자와 개발자는 데이터 오브젝트 생성 제한으로 인해 승인 완료까지의 대기시간에 많은 부담을 느낄 수 있습니다.
이러한 점을 감안하여 데이터 표준 관리자는 요청사항을 신속하게 검토하고, 데이터 표준 위반을 발견한 경우에도 통보로 끝나는 것이 아니라, 가이드 제공 및 대안 제시를 통해 설계자와 개발자를 지원해야 합니다. 또한, 데이터 표준을 준수하면 애플리케이션 품질이 높아져 변경 개발이 줄어들고, 이에 따라 시간적 손실도 줄일 수 있다는 점을 지속적으로 주지시켜야 할 것입니다.



▶   해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에 저작권이 있습니다.
▶   해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



에스코어
공유하기
배상균 상무
배상균 상무
에스코어㈜ 컨설팅사업부 데이터컨설팅팀

Managing Director, Data Consulting Team, S-Core
에스코어㈜ 컨설팅사업부 데이터컨설팅팀

기준정보 거버넌스, 데이터 품질관리 및 데이터 모델링 영역에서 15년이상 컨설팅을 수행하고 있습니다. 최근에는 S-ERP, 보험ERP 프로젝트에서 기준정보, 데이터품질 및 용어 표준화를 위한 관리체계 수립과 시스템을 구축한 바 있습니다.