제1장 데이터 표준화 개요

제1절 데이터 표준화 필요성

제2절 데이터 표준화 개념

제3절 데이터 표준 관리 도구

 

제2장 데이터 표준 수립

제1절 데이터 표준화 원칙 정의

제2절 데이터 표준 정의

제3절 데이터 표준 확정

 

제3장 데이터 표준 관리

제1절 데이터 표준 관리

제2절 데이터 표준 관리 프로세스

 

 

제1장 데이터 표준화 개요

제1절 데이터 표준화 필요성

1.데이터 관리 현황 및 개선방안

가. 데이터 활용상의 문제점

-데이터의 중복 및 조직,업무,시스템별 데이터 불일치 발생

-데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여

-데이터 통합의 어려움

-정보시스템 변경 및 유지보수 곤란

-데이터명칭이나 표준화에 대한 미준수로 동일 데이터의 구별이 어려움

 

나.데이터 문제점의 원인

-동시 다발적인 정보시스템 개발: 시스템간 상호 연관성이 증대되어 단위 시스템 위주의 개발 보다는 관련 정보시스템을 동시에 개발하는 경향이 높음

-전사 데이터 관리 마인드 미형성: 데이터에 관리 주체가 단위 시스템의 개발자, 운영자 중심으로 이루어져 있어 단위 업무 지원에 초점

-전사 데이터 관리 인력 부재: 유지 보수 단계에서는 개별 유지 보수 인력에 의존

-전사 데이터 표준 관리 도구 부재: 정보시스템 개발시에는 수작업으로 데이터 표준의 적용, 준수 체크 등을 수행하였지만 운영 단계에서 수작업에 가까운 표준 관리 방법은 많은 애로사항이 존재

 

다.데이터 관리 개선방안

-데이터 표준화, 규격화를 위한 기본 방침 설정

-전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출

-전사적인 데이터 요소 등록 및 관리 체계 구축

-정보시스템 개발 및 유지보수시 승인된 데이터 요소를 활용함으로써 시스템 개발의 효율성 및 데이터 공유성 향상

 

2.데이터 표준화 기대효과

-명칭의 통일로 인한 명확환 의사소통 증대

-필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소

-일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상

-정보시스템간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소

 

제2절 데이터 표준화 개념

1.데이터 표준화 정의

-시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것

-코드, 용어, 도메인, 메타데이터, 데이터셋 등의 표준을 수립하여 DB에 일관되게 적용하는 일련의 활동

 

가.데이터 명칭

-데이터 명칭은 해당 기업내에서 데이터를 유일하게 구별해주는 이름

-유일성: 유일하게 구분

-업무적관점의 보편성: 보편적으로 인지

-의미전달의 충분성: 데이터의 의미 및 범위 파악 가능

 

나.데이터 정의

- 데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정

#데이터 정의 기술시 고려사항

-제3자의 입장에서 기술

-의미전달이 어려울 경우 실제 데이터 값도 같이 기술

-약어 또는 전문용어 사용 지양

 

다.데이터 형식

데이터 형식은 데이터 표현 형태의 정의

#데이터 타입: Numeric, Text, Date, Char, Timestamp 등

#데이터 길이 및 소수점 자리

#데이터 형식 정의시 고려사항

-도메인을 정의하여 데이터 표준에 적용

-데이터의 최대값 또는 최대 길이가 고정이 아닌 경우 여유있게 정의

-특수 데이터 타입(CLOB 등)은 가급적 사용 안함

 

라.데이터 규칙

데이터 규칙은  발생 가능한 데이터 값을 사전에 정의하여 데이터의 입력 오류와 통제 위험을 최소화

#데이터 규칙의 유형

-기본값: 어떠한 값의 입력도 없는 경우 데이터 타입에 따라 미리 정의된 기본값이 입력

-허용값: 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한

-허용범위: 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한

2.데이터 표준화 구성요소

가.데이터 표준

#표준용어

-업무에서 자주 사용하는 속성 또는 단어의 조합을 의미

-업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진

-업무적 용어:일상 업무에서 사용하는 용어

-기술적 용어:정보시스템에서 사용하는 용어

#표준단어

-전사에서 업무상 사용하며, 일정한 의미를 갖고 있는 최소 단위의 단어

-표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의

-사용빈도가 높은 단어를 우선 정의하고 빈도가 낮은 단어는 다른 단어와 결합해서 정의

-동일한 개념을 의미하는 용어(또는 표준용어)의 생성을 예방

-유의어사용은 금지되며 대응되는 표준단어로 정의

-표준용어의 영문명 작성 기준

#표준도메인

-속성에 정의된 조건을 만족시키는 값의 범위

-칼럼에 대한 성질을 그룹핑한 개념

-문자형, 숫자형, 일자형, 시간형으로 분류

-동일한 성질을 가진 컬럼의 데이터 타입 및 데이터 길이를 일관되게 관리

-금액, 날짜, 내용, 명칭, 수량, 여부, 율, 번호, 코드 등 그룹핑

#표준코드

-도메인의 한 유형, 특정 도메인 값(코드값)이 이미 정의되어 있는 도메인

- 데이터 값, 즉 코드값까지 미리 정의

#기타 데이터 표준관련 요소

-데이터 모델에서 정의하는 주제영역, 관계명과 데이터베이스에서 정의하는 데이터베이스, 데이터베이스 스키마, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리

 

나.데이터 표준 관리 조직

-데이터 관리자는 하나의 기업 또는 조직 내에서 데이터에 대한 정의, 체계화, 감독 및 보안 업무를 담당하는 관리자

1)데이터 관리자의 주요 역할

-데이터에 대한 정책과 표준 정의:데이터에 대한 표준화 원칙 및 표준을 정의

-부서간 데이터 구조 조율:전사 데이터 관리 기준에 의거하여 단위 시스템이나 조직 부처에 명확한 데이터 관리 기준을 제시

-데이터 보안관리:데이터에 대한 보안 정책 수립, 보안 정책 준수 여부 체크, 보안 시정 조치 요구등을 수행

-데이터 모델 관리:데이터에 대한 중요한 의사소통의 도구가 되는 데이터 모델을 물리적인 변경 시점에 동일하게 관리

-데이터의 효율적인 활용방안 계획

 

2)데이터 관리자의 세부역할

-전사 데이터관리자

-데이터 표준화에 대한 정책 결정

-검토된 데이터 표준 제안에 대한 승인

-업무 데이터관리자

-담당 업무 기능의 데이터 요구사항 반영을 위해 필요한 데이터 표준 정의

-업무관련 데이터 표준 변경 제안에 대한 합동 검토

-업무시스템 데이터관리자

-시스템 관리목적의 데이터 요구사항을 위해 필요한 데이터 표준 정의

-업무 관련 데이터 표준 변경 제안에 대한 합동 검토

-데이터모델에 대한 데이터 표준 적용 및 준수 여부 체크

 

#DBA와 DA 비교

구분 데이터 관리자(DA) 데이터베이스 관리자(DBA)
관리 대상 데이터 요구 사항을 반영한 데이터 모델 및 각종 표준 데이터 모델을 특정 데이터베이스 제품의 특성에 맞추어 구축한 데이터베이스
주업무 업무에 필요한 데이터의 메타데이터를 정의하고 신규 또는 변경된 요구 사항을 신속하게 데이터 모델에 반영 요구되는 성능 수준을 발휘하면서 안정적 으로 운영되도록 데이터베이스를 관리
품질 수준 확보 데이터 표준의 관리 및 적용을 통해 품질 수준을 확보 데이터의 정합성 관리를 통해 데이터 품질 수준을 확보
전문 기술 담당 업무 분야에 대한 업무 지식과 데이 터 모델링에 대한 전문성이 필요 데이터 모델에 대한 해독 능력 및 특정 데 이터베이스 제품에 대한 전문 지식이 필요



다.데이터표준화 절차

-데이터 표준화 요구사항 수집: 개별시스템 데이터 표준 수집. 데이터 표준화 요구사항 수집. 표준화 현황 진단

-데이터 표준 정의: 표준화 원칙, 데이터 표준 정의( 표준용어, 단어, 도메인, 코드)

-데이터 표준 확정: 데이터 표준 검토 및 확정. 데이터 표준 공표

-데이터 표준 관리: 데이터 표준 이행. 데이터 표준 관리 절차 수립: 데이터 표준 적용, 변경, 준수 검사 절차

 

*표준안 신규적용 절차

-표준화 요구사항과 현행 문서 수집

-표준화 문제점 도출

표준을 정의하기 위한 원칙과 절차 수립

제3절 데이터 표준 관리 도구

-수립된 전사 데이터 표준 정보의 관리, 데이터 표준에 의한 개발 및 유지보수 지원, 데이터 표준 준수 및 변경 영향도 평가를 담당하는 기능으로 구성

1.확장된 데이터 표준 관리도구의 기능

-데이터 모델 관리: 데이터 표준 관리 도구를 이용하여 개념, 개괄, 논리, 물리 모델에 대한 조회 및 변경 관리를 하는 기능

-데이터 표준 관리: 표준 단어, 표준 도메인 등의 표준 관련 사전을 관리하는 기능

-데이터 품질 관리: 데이터 품질 진단 및 분석과 비즈니스 규칙 등을 관리하는 기능

-OLAP 정보 관리: OLAP 시스템에 구현된 메타 정보와 연계하여 관리하는 기능

사용자 권한 관리: 현업 및 IT 사용자에 대한 권한 관리 기능

-변경 영향도 분석: 표준 및 모델 변경에 따른 전체 영향도를 분석하는 기능

-ETL 정보 관리: 계정계부터 최종 사용자까지 데이터 흐름 및 매핑 정보에 대한 관리 기능

표준 요청 관리: 표준의 신규 및 변경에 따른 절차와 승인 관리 기능

-JOB 관리: ETL 프로그램의 정상 및 오류 여부 등을 관리하는 기능

-DB 스키마 관리: 데이터 모델과 실제 DB와의 일치성 등을 관리하는 기능

 

2.데이터 표준 관리 시스템 기능

가.데이터 표준 관리 기능

-단어관리: 전사 관점에서의 단어 사전 관리, 금칙어의 사전 정의 및 관리

-용어관리: 업무적으로 정의된 표준 용어에 대한 관리, 기본 단어의 조합으로 업무 용어를 생성함

-도메인관리:  대표 및 그룹 속성에 대한 데이터 타입, 길이, 소수점 이하 길이 등을 사전에 정의한 도메인 관리

-코드관리:  수집된 코드로부터 코드 통합 과정을 거쳐 전사 표준 코드를 도출한 후 관리, 소스 코드 값과 표준 코드와의 변환 매핑 관리

-멀티표준관리:코드, 칼럼, 테이블, 도메인 등에 대하여 멀티 표준을 관리해서 전사에 존재하는 여러 표준을 지원하고 이후 전사 표준으로 통합 되도록 함

 

나.데이터 구조 관리 기능

-ER 모델 구조 관리: ER 모델 관리,  리포지터리에서 데이터 구조 정보를 추출 및 로드

-DB 스키마 관리: 다양한 DBMS로부터 DB 카탈로그를 추출 및 로드

-가변 속성 관리: 모델 기본 속성 외에 설계 속성을 쉽게 추가

-이력 관리: 데이터 모델 변경 이력, 형상 관리 지원

-모델 비교 관리:  데이터 구조 정보에서 표준화 자동 검사, 표준에 대한 준수도 자동 검사, 데이터 구조 정보 간 비교

 

다.프로세스 관리 기능

-표준등록: 코드, 칼럼, 테이블, 도메인 등에 대한 사용자 요청부터 데이터관리자의 승인/반려 기능 지원

-모델등록: 엔터티, 속성, 테이블, 칼럼 등 데이터 모델에 대한 사용자 요청을 등록하고 관리자의 승인/반려 기능을 지원

 

3.데이터 표준관리시스템 도입시 고려사항

-확장성: 다양한 시스템 및 DBMS의 정보 수집과 OLAP 툴 등의 다양한 데이터 구조 정보를 추출 할 수 있는지 검토

-유연성: 단계적 적용을 위한 여러 개의 통합 표준을 사용할 수 있는 복수 표준 관리가 가능한지와 한글명 및 영문명의 표현 방식, 표준의 변경 용이성을 검토

-편의성: 한글명의 영문명 자동 변환, 표준 검증의 주기적인 작업 수행 기능, 메타 정보 수집시 IMPORT 수작업 최소화 등 사용자 편의성을 검토

 

4.데이터 표준관리 시스템 부재시 관리 방법

가.모델링 도구 사전 활용

나.엑셀 등의 문서로 관리

제2장 데이터 표준 수립

제1절 데이터 표준화 원칙 정의

1.데이터 표준화 요구사항 수집

-현업 및 개발자로부터 데이터 표준과 관련된 요구 사항을 인터뷰 및 설문조사 등을 통하여 조사함으로써 전사 데이터 표준 대상 후보를 식별하고 개선점을 도출하는데 사용할 자료를 마련

 

2.현행데이터 표준 원칙 분석

-현행 정보시스템에서 적용하고 있는 데이터 표준 원칙 및 데이터 표준을 수집하고, 수집된 자료를 통하여 식별된 데이터 표준의 관리 대상 및 현황을 파악

가.현행 데이터 표준 원칙 수집

-현행 정보시스템에 적용되고 있는 데이터 표준에 대한 원칙을 수집

#현 정보시스템 개발 지침 문서 및 데이터 표준의 확보

-현행 데이터 표준 원칙은 기존 정보시스템을 개발할 당시 작성하고 적용되었던 개발 지침 문서 및 데이터 표준을 통하여 수집

#현행 정보시스템 모델의 분석

-현행 데이터 모델 또는 데이터베이스 스키마에서 보여지는 오브젝트의 정의 패턴 분석을 통하여 정보시스템 구축시 적용했던 원칙을 유추

 

나.데이터 표준 원칙 사용 현황 분석

-수집된 데이터 표준 원칙 자료를 토대로 현행 정보시스템에서 적용하고 있는 데이터 표준 대상 및 관리 항목을 도출

 

3.데이터 표준 개선방안 정의

-현행 데이터 표준 사용 현황 명세서와 표준화 요구 사항 정의서를 토대로 하여 데이터 표준 대상별 문제점 및 개선 방안을 도출

 

4.데이터 표준 원칙 수립

-현행 데이터 표준에 대한 개선 방안을 토대로 향후에 적용할 전사 데이터 표준 기본 원칙을 정의하고, 향후 전사 데이터 표준의 생성 및 변경시 참고할 수 있도록 각 데이터 표준 대상별 데이터 표준 원칙을 작성하여 문서화

 

가.데이터 표준 기본 원칙 정의

-데이터 표준 개선 방안을 참고하여 전체적으로 적용할 기본 원칙을 수립함으로써 표준화에 대한 방향을 사전에 정의

 

나.데이터 표준 지침 작성

-모든 사용자들이 참고해야 하는 데이터 표준화에 대한 구체적인 지침 문서를 작성

1)데이터 표준 지침의 기본 구성

-데이터 표준 지침은 데이터 표준 대상별로 어떻게 표준화할 것인가에 대해 구체적으로 정의한 문서

*개요: 데이터 표준화 및 데이터 표준 지침에 대한 목적

*데이터 표준화 관련자의 역할과 책임: 데이터 표준화와 관련된 사용자들을 정의하고 그들의 역할 및 책임을 규정. 전사 데이터 관리자, 데이터 관리자, 모델러

*데이터 표준 관리 절차: 데이터 표준과 관련된 일련의 작업 프로세스를 규정하고, 프로세스별로 데이터 표준화 관련자들의역할을 기술

*데이터 표준 기본 원칙: 데이터 표준 대상 모두에 대해 일반적으로 적용되어지는 기본 원칙

*데이터 표준 대상별 명명규칙: 데이터 표준 대상별로 데이터 표준 명칭을 작성하는 방법에 대해 구체적으로 기술

-사용문자: 알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용 조건을 규정

-영문 대소문자: 알파벳을 사용할 경우 대소문자 사용과 관련한 규칙을 규정

-한글명과 영문명 동시 정의 여부: DBMS에 반영되는 객체들은 대부분 알파벳으로 정의하도록 되어 있는 경우가 있기 때문에 이와 관련된 데이터 표준 정의 대상에 대해서는 한글명과 영문명의 정의가 필요, 표준용어, 단어가 해당

-명칭의 구조: 표준 용어를 사용하는 테이블명 및 칼럼명의 경우 명칭을 통하여 그 특성 또는 부가 정보를 표시할 수 있도록 명칭에 대한 단어 표준 조합 구조를 명시. 예) 수식어 + [수식어] + 속성 유형(금액, 건수, 코드 등)

-명칭에 대한 허용길이: 표준 용어를 사용하는 테이블명 및 칼럼명의 경우 DBMS의 물리적 특성으로 길이의 제약을 받기 때문에 표준 용어의 허용 길이를 명시

-명칭 표준화에 대한 기준: 유사한 개념의 단어/용어가 복수개 존재할 경우 어떤 기준으로 표준 단어/ 표준 용어로 선택할 것인가를 결정하는 기준을 정의
예) 일련번호, ID, SEQ --> ID로 표준화

-명칭에 대한 예: 명칭에 대한 허용 길이, 명칭 구조 체계, 명칭 표준화 기준 등을 준수하여 작성된 샘플을 몇 가지 명시

 

*데이터 형식 정의에 대한 기준: 데이터 표현 형태를 정의하는 기준 및 방법

 

2)주요 데이터 표준 대상별 지침의 일반적인 구성

-데이터 표준 대상에 대한 세부 지침은 각 데이터 표준 대상의 특성에 맞게 기술

표준단어:
-한글명 및 영문명에 대한 알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용조건
- 대소문자 사용 규칙
- 한글명, 영문명에 대한 허용 길이
- 합성어(단어의 조합으로 이루어진 단어) 정의에 대한 지침
- 접두사에 대한 처리 방안
- 동음이의어/이음동의어 허용 여부 및 처리 방안

표준용어:
- 데이터 명칭에 대한 구조 체계
- 한글명, 영문명에 대한 허용 길이
- 용어를 테이블이나 컬럼명으로 사용할 경우 준수해야 할 특이한 명명규칙
- 용어를 컬럼명으로 사용할 경우 데이터 형식 표준화에 대한 기준 및 표준 도메인 적용 여부

표준도메인:
- 데이터 형식 표준화에 대한 기준

표준코드:
- 데이터 명칭에 대한 구조 체계 및 명명에 대한 기준
- 데이터 형식 표준화에 대한 기준
- 코드번호 체계 정의에 대한 규칙

 

3)데이터 표준 개발 지침 작성 시 유의사항

-DBMS마다 허용하는 테이블 및 칼럼의 물리명 길이가 상이함: 영문명의 허용길이 정의시 고려

-DBMS마다 정의하고 있는 데이터 타입이 각기 상이함

제2절 데이터 표준 정의

1.표준 단어 사전 정의

-기존 데이터 모델 및 용어집을 통해 해당 기관에서 사용되고 있는 모든 단어를 추출

-추출된 단어는 단어 종류와 유형을 분류하고 업무 정의 및 용도를 고려하여 표준 단어를 정의

가.표준 단어 사전

-단어:문법상 일정한 뜻과 구실을 가지는 말의 최소 단위

-표준 단어 사전: 기업에서 업무상 사용하며 일정한 의미를 갖고 있는 최소 단위의 단어를 정의한 사전

1)표준 단어 관리 기준(표일대)

표준성: 정보시스템이나 일반적인 업무에서 사용되는 단어 가운데에서 추출

일반성: 일상적으로 사용하고 있는 사전적 의미의 단어와 의미상 크게 다르지 않아 일반인도 해당 단어의 의미를 이해 가능

대표성: 동의어를 가질 수 있으며 표준 단어로 선언된 단어는 비슷한 의미의 동의어들을 대표

 

2)표준 단어 작성 형식

-표준 단어는 전사적으로 관리하고 있는 엔터티와 속성을 개별 단위로 하여 추출하며, 추출된 단어는 동음이의어와 이음동의어를 정비한 후 논리명(한글명)을 기준으로 물리명(영문명, 영문약어명), 유사 용어까지 함께 정리하여 관리

-표준 단어 사전에는 개별 단어 외에도 동의어, 유의어, 반의어 등과 같은 단어 간의 구조도 함께 정의

이음동의어: 한글명 및 영문명을 분석 후에 업무적으로 가장 대표적인 표준단어를 선택

 

나.표준 단어 정의

1)현행 용어 수집

-기업 내 존재하는 모든 정보시스템에 대한 데이터 모델 또는 테이블 정의서와 칼럼 정의서를 분석하여 현행 용어에 대한 한글명 및 영문명을 수집

2)단어 분할

-수집된 현행 용어에서 업무상 사용되며 일정한 의미를 갖고 있는 최소 단위의 단어로 분할

3)단어 정련

-분할하여 취합된 모든 단어 중에서 의미가 동일한 단어들에 대해 하나의 대표 단어를 표준으로 선정하고 그에 대한 영문 약어명을 선택

4)표준 단어 사전 정의

단어 정련 작업을 통하여 표준으로 선택한 모든 단어들에 대한 한글명 및 영문명을 표준 단어 사전에 등록

 

다.표준 단어 정의시 고려사항

-표준 단어의 단위는 최소 단위를 기준으로 하되 사용 빈도가 높은 단어의 조합 또는 단어의 조합이 하나의 고유한 의미를 가지는 경우 하나의 표준 단어로 정의

-표준 단어의 영문명도 반드시 알파벳으로 시작하도록 정의

-단어는 특히 동음이의어가 많기 때문에 사용빈도가 높은 것을 표준 단어로 사용빈도가 낮은 것은 다른 단어와 조합하여 표준 단어로 정의

 

#접두어/접미어 개별

-단어개수 많지 않음,

-일관된 단어사전,

-물리DB 제약 자리수를 넘는 경우 발생,

처리할 수 없는 경우 발생(물 , 손 )

 

#접두어/접미어 합성

-단어개수 많음, 

-단어의 다용도 사용으로 일관성 떨어짐,

-물리DB 제약 자리수 넘을 가능성 낮음,

-사용자 편의성 높음



2.표준 도메인 사전 정의

-업무적인 용도, 사용 빈도와 데이터의 물리적인 특성 등을 고려하여 도메인을 분류하고 도메인별 데이터 타입을 부여

가.표준 도메인 사전

-도메인:속성에 정의된 조건을 만족시키는 값의 범위
-표준 도메인은 전사적으로 사용되고 있는 데이터 가운데에 논리적, 물리적으로 유사한 유형의 데이터를 그룹화하여 해당 그룹에 속하는 데이터의 유형과 길이를 정의한 것

1)표준 도메인 관리 기준(표유업)

-표준성: 표준 도메인은 전사 차원에서 공통적으로 사용되는 속성을 대상으로 정의

-유일성: 동일한 내용의 중복 도메인이 서로 다른 이름으로 선언되지 않도록 관리

-업무지향성: 업무의 특성을 충분히 반영할 수 있도록 선언하여 관리

 

2)표준 도메인 작성 형식

-전사적으로 관리하고 있는 모든 데이터 속성 혹은 대표 속성 가운데에 DBMS에 동일한 형태로 구현되는 속성들을 추출하여 그룹화

 

나.표준 도메인 정의

-정보시스템별로 혼재되어 사용되고 있는 칼럼의 칼럼명, 데이터 타입, 길이 등을 정리하여 표준 도메인을 정립

1)현행 용어 정보 분석

-기업 내 존재하는 모든 정보시스템에 대한 데이터 모델 또는 칼럼 정의서를 이용하여 현행 용어에 대한 용어명과 데이터 타입 정보를 수집한 뒤 물리적으로 유사한 유형의 용어들을 그룹화

-동일한 정보시스템에 대한 데이터 모델에서 추출된 현행 용어들을 유일하게 추출.
-데이터 타입과 길이가 동일한 용어들을 검색하여 유사한 속성의 용어들을 그룹핑.
-용어명 중에서 끝 쪽 단어를 기준으로 유사한 속성의 용어들을 그룹핑

2)표준 도메인 정의

-그룹핑된 유사 속성 용어의 의미에 따라 표준 도메인명을 정의하고 그에 따른 데이터 타입 및 길이를 정의

- 업무적으로 의미가 있는 도메인명을 부여
- 기존 데이터와의 호환성 및 범용성을 위하여 그룹핑된 용어들에게 부여된 데이터 타입 길이 중 가장 큰 데이터 타입 길이를 표준으로 정함

 

다.표준 도메인 정의시 고려사항

-현실적으로 어느 도메인에도 속하지 않는 칼럼이 있을 수 있기 때문에 모든 용어를 포괄하는 표준 도메인을 생성할 필요는 없음

-표준 도메인에 정의할 데이터 형식을 어떻게 정의하고 각기 다른 DBMS에 어떻게 물리적으로 적용할 것인가에 대한 방안을 고려

-표준 도메인을 도출하면서 동일한 용어로 판명된 현행 용어들을 별도로 기록하여 향후 동일한 데이터 표준 용어로 통일할 때 참고

 

3.표준 코드 사전 정의

-표준 코드 정의는 수집된 용어로부터 코드를 선별하여 현 코드의 코드값을 조사

현 코드를 바탕으로 통합 요구 사항과 통합 필요성에 따라 통합 대상을 파악하고 표준 코드를 정의하고 현 코드와 매핑 설계

가.표준 코드 사전

-표준 코드에는 각 산업별로 법·제도적으로 부여하여 공통적으로 사용되는 코드뿐만 아니라 기업 내부에서 정의하여 사용하는 코드도 포함

1)표준 코드 관리 기준(재일정)

-재사용성: 표준 코드는 기업에서 자체적으로 정의하여 사용하는 것보다 표준화 기구나 정부, 공공기관에서 정의한 코드를 재사용

-일관성: 코드는 업무 범위 내에서 가능한 한 유일하게 정의

-정보분석성: 가능한 범위의 데이터는 모두 코드화하여 관리

 

2)표준코드 작성 형식

-전사적으로 사용하고 있는 코드를 추출하여 정의하고 부여된 코드와 동일한지를 확인하고, 동일한 값을 가지는 코드에 대해서 통합 작업을 수행하여 단일화 작업을 수행

 

나.표준 코드 정의

-표준 코드는 각 정보시스템별로 사용되고 모든 코드들을 수집하여 동일 코드를 파악하고 통합하여 표준 코드를 정의

1)현행 코드 수집

-기업 내 존재하는 모든 정보시스템에서 사용하는 코드 정보를 수집

#코드 관리 형태

-단독 코드 테이블: 하나의 코드를 하나의 테이블에서 관리하는 형태

-통합 코드 테이블: 복수개의 코드를 하나의 통합 관리 테이블에서 관리하는 형태

-애플리케이션 정의: 코드를 데이터베이스에 저장하여 관리하지 않고 애플리케이션에서 정의하여 관리하는 형태

#코드 파악 방법

-코드 데이터 값 수집: 코드를 관리하는 테이블, 통합 코드 테이블, 애플리케이션 사용자 인터페이스를 통하여 코드 정보를 수집

-코드성 칼럼 파악: 각 정보시스템의 테이블에 존재하는 칼럼 중에서 코드 정보를 저장하는 코드성 칼럼을 파악

-수집된 코드에 대한 사용처 파악: 식별한 코드성 칼럼별로 어떠한 코드를 저장하는지를 파악함으로써 누락된 코드를 확인

 

2)현행 코드 상세 분석

-수집된 현행 코드 정보를 상세히 분석함으로써 동일하거나 통합이 가능한 코드를 식별

-코드값이 일치하는 동일한 코드 인스턴스를 가지는 코드를 찾은 뒤 해당 코드의 모든 코드 인스턴스를 확인하고 비교함으로써 통합 가능한 코드를 식별
-분석해야 할 대상 코드가 너무 많을 경우에는 코드를 사용하는 업무 기능별로 코드를 분류한 후, 분류된 단위로 코드를 분석

 

3)표준 코드 정의

-현행 코드 상세 분석을 통하여 식별된 통합 대상 코드의 코드 인스턴스를 정련하여 통합

-통합 대상이 없는 코드는 현행 코드 인스턴스를 그대로 유지하는 것이 일반적
-통합 대상이 존재하고 통합 대상 코드의 코드 번호가 서로 상이할 경우 새로운 코드 번호를 부여함으로써 표준 코드를 정의

 

다.표준 코드 활용

-모든 정보시스템은 표준 코드를 사용

-일부 업무에서 특정 코드의 모든 코드 값을 사용하지 않고 범위를 한정하여 일부 코드값만 사용 할 경우에는 표준 코드로부터 파생된 코드를 정의하여 사용

 

라.표준 코드 정의시 고려사항

-코드값은 향후 확장성을 고려하여 정의하여야 하며, 여러 업무에서 사용할 수 있도록 통합된 코드로서의 일관성을 유지.
-시스템 운영 중에 코드값이 변경되는 경우 해당 코드를 사용한 기존 데이터의 유지를 위해 기존 코드값을 삭제하는 대신 사용 중지 상태로 관리하고 새로운 코드값을 신규로 정의.
-표준 코드를 도출하면서 파악한 표준 코드-현행 코드 간의 변환 매핑 정보를 별도로 기록하여 향후 신규 정보시스템으로의 데이터 이행시 참고

 

*코드표준화순서

-현행코드관련자료수집

-코드도메인 분류 및 중복 제거

-동일 의미 코드의 통합

- ASIS 코드와 TOBE코드 매핑

 

4.표준 용어 사전 정의

-단어, 도메인, 코드 표준이 정의되면 이를 바탕으로 표준 용어를 구성하고, 단어의 조합, 도메인 분류, 데이터 타입 길이, 코드값 등을 기준으로 해서 표준 적용이 업무적으로나 IT적으로 무리가 없는지 검토

가.표준용어사전

-용어는 업무에서 자주 사용하는 단어의 조합을 의미
-표준 용어는 전사적으로 사용하는 엔터티와 속성을 대상으로 표준 단어 사전에 정의된 단어를 조합하여 정의

-단어는 개별적이나 용어는 업무와 조직의 성격에 따라 그 조합이 달라질 수 있음

1)표준 용어 관리 기준(표일업)

-표준성: 용어의 표준화를 통해 용어 사용의 차이에 따라 발생되는 전사 차원 의 혼란을 최소화

-일반성: 용어가 지나치게 업무 관점에서만 정의되어 일반적으로 이해하기 힘들거나 의미상에 혼란을 초래해서는 안됨

-업무지향성:용어는 기업의 업무 범위 내에서 약어를 사용하거나 내부에서 별도로 정의 가능. 지나친 약어 사용은 주의

 

2)표준 용어 작성 형식

-표준 용어는 전사적으로 보유하고 있는 엔터티와 속성을 대상으로 추출된 표준 단어를 조합하여 생성되며 용어 사전은 엔터티 용어 사전과 속성 용어 사전으로 구분하여 정의

-정의된 각각 의 용어는 논리명(한글명)과 물리명(영문명)을 가지며, 용어 범위 및 자격 형식 등을 설명

 

나.표준 용어 정의

-정보시스템별로 사용되고 있는 모든 현행 용어를 수집하고 표준 단어 사전, 표준 도메인 사전, 표준 코드 사전 등을 참조하여 현행 용어에 대한 표준 용어를 도출

1)현행 용어에 대한 표준 단어 도출 및 표준 용어 정의

-현행 용어로부터 표준 용어의 도출은 단어 수준에서의 표준화를 통해 이루어짐

2)표준 단어에 대한 도메인/코드 정의

-표준 도메인을 도출하면서 별도 관리했던 정보를 가지고 표준 단어에 대한 도메인을 정의 가능

 

다.표준 용어 정의시 고려사항

표준 용어 도출시 데이터 표준 원칙에서 정의한 한글명 및 영문명의 허용 길이를 넘지 않도록함

만약 영문명의 허용 길이가 문제가 된다면 한글명을 변경하거나 한글명을 구성하는 표준 단어들 중 일부를 조합하여 하나의 표준 단어를 등록하여 영문명의 길이를 축약

생성된 표준 용어가 너무 길다면 두개의 표준 용어를 복합하여 생성하는 방법도 고려

 

*표준용어변경시 직접적인 영향: 표준단어, 표준도메인, 기존업무용어, 표준코드값은 직접적인 영향이 없음

*표준용어변경시 검토할 문서: 신규로 정의된 코드명칭

제3절 데이터 표준 확정

1.데이터 표준 검토

-데이터 관리자가 정의한 표준단어사전, 표준도메인사전, 표준코드, 표준용어사전 등을 확인하고 해당 용어가 현재 사용되고 있는 용어로 정확하게 정의되어 있는지를 확인하고 승인

가.데이터 표준 검토 계획 수립

-데이터 표준 검토 대상이 되는 자료를 확인

-검토 기준은 전사 데이터 표준 기본 원칙 및 각 대상별 데이터 표준 지침을 근거로 작성

-유일성: 각 데이터 표준이 물리적으로나 의미론적으로나 유일한지 확인

-완전성: 각 데이터 표준 대상별 필수 입력 사항들이 전부 정의되었는지 확인

-정확성: 각 데이터 표준 대상별 입력 사항이 충실히 입력되었는지 확인

-범용성:정의한 데이터 표준이 여러 정보시스템에서 적용이 가능한지 확인하고, 향후 개발할 각 정보시스템에 적용할 수 있도록 검토 계획을 수립

 

나.데이터 표준 검토

-검토 기준 및 검토 대상 산출물을 준비하고 검토에 참여할 대상자에게 배포

-검토 관련 장소, 시간, 준비 장비 등 검토를 실시하기 위한 제반 준비를 수행하며, 검토 담당자별로 검토 세션에서 수행해야 할 역할을 주지시킴

-검토시 진행자는 제기되는 이슈에 대해서 참석자들간에 결론을 도출하기 위한 토론이 발생하지 않도록 이슈 목록으로 정리하고 검토가 정해진 일정 내에 마치도록 주의

-검토 세션이 종료되면 세션별로 그 결과를 정리

-검토 결과가 정리되면 데이터 표준 대상별로 보완 사항을 작성

 

다.데이터 표준 보완 및 승인

-보완 결과에 대해 확인 준비. 검토 결과, 보완 목록, 보완 사항이 반영된 데이터 표준을 준비하고 배포.

-보완 목록에 준하여 데이터 표준 반영 여부를 확인. 반영되지 않은 사항 중 미반영 사유가 존재할 경우에는 미반영 사유가 타당성이 있는지를 검토하고 사유가 타당하지 못한 경우에는 보완.

보안 목록에 있는 보완 사항이 모델에 모두 반영된 것을 확인하면 본 작업을 종료하고 전사 데이터 관리자의 승인을 획득.

 

2.데이터 표준 공표

-확정된 데이터 표준을 배포하여 전사 시스템에 적용 가능하도록 하며, 관련 내역에 대한 이해 및 적용을 위한 교육을 수행

가.데이터 표준 배포

-검토가 종료되고 전사 데이터 관리자의 승인을 득한 데이터 표준은 데이터 표준 관리 도구에 등록하여 전사의 모든 사용자가 데이터 표준을 조회할 수 있도록 조치하고, 정보시스템 개발 관련자들이 데이터 표준을 준수하여 개발할 것을 공지

나.데이터 표준 교육

-데이터 표준에 대한 이해 및 효과적인 적용을 위해 사용자 및 운영자에 대한 교육 훈련 계획을 수립하고, 데이터 표준 지침 및 기타 데이터 표준 관련 교육 교재를 작성하고 교육을 수행

 

제3장 데이터 표준 관리

제1절 데이터 표준 관리

1.데이터 표준 관리 개요

-개별적인 데이터 표준화 요소에 대한 표준화 작업 절차 이후, 데이터 표준 정의 단계에서 수립된 데이터 표준에 근거하여 관리 프로세스를 정립하여 데이터 표준 관리

2.데이터 표준 관리 프로세스 유형

-정의된 데이터 표준이 개발 과정이나 운영 과정에서 발생하는 데이터 표준의 신규 요건이 발생한 경우에 이를 처리하기 위한 프로세스

-데이터 표준이 변경 또는 삭제되는 경우, 관련 데이터 표준화 요소와 데이터 모델, 데이터베이스, 관련 프로그램까지 영향도를 분석할 수 있는 절차와 이를 처리하기 위한 프로세스

-데이터 표준을 잘 준수하고 있는지를 수시로 체크하고 확인할 수 있는 프로세스

 

제2절 데이터 표준 관리 프로세스

1.데이터 표준 관리 프로세스 구성요소

-프로세스, 태스크, 역할과 담당 업무가 명확하게 정의

2.구성요소별 설명

가.프로세스

-데이터 표준이 신규로 발생하거나 변경 사항이 발생하는 경우에 거쳐야 할 전체적인 업무 프로세스

나.태스크

#표준 신규/변경 요청

-업무 담당자는 데이터 관리자에게 표준 단어, 표준 용어, 표준 도메인 등 데이터 표준 대상을 신규 또는 변경 요청

#표준 준수 검토

-요청된 사항에 대해서 데이터 관리는 요청된 사항에 대한 표준 준수 여부를 검토하고 검토 결과를 업무 담당자에게 피드백하며 준수 여부 체크시 요청한 용어가 해당 용어 설명에 부합하는지, 요청한 용어가 기존 용어의 의미와 중복되는지 여부를 체크

다.역할과 담당업무

#업무 담당자
- 표준 신규 및 변경 요청
- 데이터 관리자로부터 지시받은 변경 내용 적용

#데이터베이스 관리자
- 데이터 관리자로부터 변경 표준 사항에 대한 변경 영향 파악 협조 및 평가서 작성
- 데이터 관리자로부터 지시받은 변경 내용 적용
- 테스트 및 검증 

- 사용자 반영 결과 통보

#데이터 관리자
- 업무 담당자로부터 요청받은 신규 및 변경 사항 검토 및 표준 준수 여부 체크
- 변경영향도 분석 및 보고 후 변경 계획 수립
- 준수 여부 체크 후 메타 DB에 표준 등록
- 메타 DB에 등록 완료 후 신규 및 변경 표준 배포
- 업무 담당자 및 데이터베이스 관리자에게 변경 작업 지시 후 변경 작업 수행 결과 확인

#전사 데이터 관리자
- 전사 관점에서의 표준 가이드 자문 및 제시

 

#DA가 이뤄야할 3가지 통합성

-EA범위 전체에 대한 각 모델 내의 불일치성 제거

-관련된 타 도메인과의 불일치성 제거

-관련된 관점간의 불일치성 제거

 

 





 

맨 위로 이동

 

DAP 1장 전사아키텍처 이해

 

DAP 2장 데이터 요건 분석

 

DAP 4장 데이터 모델링

 

DAP 5장 데이터베이스 설계와 이용

 

DAP 6장 데이터 품질 관리 이해

 

Posted by Lumasca
,