1.데이터 이해
1.1데이터 품질 관리 프레임워크
가.데이터 품질 관리 프레임워크
-데이터 품질 관리: 조직 내외부의 지식 노동자와 최종 사용자의 기대를 만족시키기 위한 지속적인 데이터 및 데이터 서비스 개선 활동
-데이터 품질 요소: 데이터 값, 데이터 구조, 데이터 관리 프로세스
1.2표준 데이터
가.정의 및 관리 목적
-정보시스템에서 사용되는 용어 및 도메인, 코드, 기타 데이터 관련 요소에 대해 공통된 형식과 내용으로 정의하여 사용하는 표준 관련 데이터
나.세부 관리 대상
표준단어,도메인,코드,용어
1)표준단어 사전(표참일대)
-기업이나 기관에서 업무상 사용되며 일정한 의미를 갖고 있는 최소 단위의 단어를 정의한 사전
#기준
*표준성: 대상업무 범위에서 사용, 사전적 의미의 단어, 약어 사용 최소화
*참조가능성: 새로운 업무에서 참조
*일반성: 일반인도 이해 가능
*대표성: 비슷한 의미의 동의어들을 대표
2)표준도메인 사전(표유업)
-전사적으로 사용되고 있는 데이터 중에서 논리적, 물리적으로 유사한 유형의 데이터를 그룹화하여 해당 그룹에 속하는 데이터의 유형과 길이를 정의한 사전
#기준
*표준성: 공통적으로 사용되는 속성이 대상
*유일성: 동일한 도메인의 다른 이름 선언 방지
*업무지향성: 업무의 특성을 반영
-여러개의 하위도메인으로 구성되거나 하나의 도메인이 여러개의 도메인에 중복 사용 가능
3)표준용어 사전(표일업)
-전사적으로 사용하는 엔터티와 속성을 대상으로 표준 단어 사전에 정의된 단어를 조합하여 정의
#기준
*표준성: 동일한 의미의 서로 다른 용어를 표준화
*일반성: 일반적인 의미와 비슷하게
*업무지향성:지나친 약어 사용 자제. 보유중인 표준 단어를 조합하여 생성
-기업의 업무범위내에서 약어를 사용하거나 내부에서 별도로 정의하여 사용가능.
4)표준코드(재일정)
-각 산업별로 법적, 제도적으로 사용하는 코드, 내부에서 정의하여 사용하는 코드
#기준
*재사용성: 정부, 기관에서 정의한 코드를 재사용하는게 효과적
*일관성: 업무범위내에서 유일하게 정의
*정보분석성: 가능한 범위의 데이터는 모두 코드화, 임의 텍스트 입력 최소화
5)데이터 표준 요소(통일)
-시스템을 설계하고 구축하는데 필요한 데이터 관련 요소의 표준
-데이터 관련 요소 표준 대상은 논리 데이터 모델의 주제 영역, 엔터티, 속성, 관계명을 포함하여 물리적 객체 대상인 Subject Areas, Relationships, Database & Instance, Indexes, Constraints, Sequences, 사용자 정의 Procedures & Functions, Synonyms, Views, Rollback Segments, Tablespaces, File Names, Script Names 등의 명명 규칙을 포함
#기준(통일성, 일관성
*통합성: 전사적으로 통합 관리 및 적용
*일관성: 데이터 모델 및 DB 스키마의 전 영역에 걸쳐 일관되게 적용
다.표준 데이터 상관도
1.3모델 데이터
가.정의 및 관리 목적
-데이터 모델을 운용 관리하는데 필요한 데이터
난.세부 관리 대상
-DRM, 개념/논리/물리 데이터 모델에 대한 메타 데이터 및 DBMS 객체 정보
#기준(완일추상최호)
*완전성: 개념, 논리, 물리 데이터 모델에 대한 모든 메타 데이터를 포함
*일관성: 단어, 용어, 도메인 및 데이터 관련 요소 표준을 준수
*추적성: 데이터 모델의 변경 이력에 대한 추적 용이
*상호연계성: 데이터 모델간의 상호 연관 관계를 표현
*최신성: 단계별 데이터 모델과 업무규칙은 물론, 물리 데이터와도 논리적으로 일치
*호환성: 다른 종류의 관리 데이터와도 상호 호환 가능
1.4관리 데이터
가.정의 및 관리 목적
-DB를 효과적으로 운영, 관리하기 위해 필요한 데이터
나.세부 관리 대상
-사용/ 장애 및 보안/ 성능/ 흐름/ 품질
1)사용 관리 데이터
-사용자가 DB를 효과적으로 사용할 수 있도록 지원하고 문제를 해결하는데 필요한 관리 데이터
#기준(활만소)
*데이터 활용도: 주기적으로 데이터 사용 추세를 파악하여 데이터 활용 가치 평가
*사용자 만족도: 제공되는 데이터에 대한 만족과 유지되는 데이터의 품질을 보증
*문제해결 소요기간: 문제 발생에서 확인까지 소요되는 시간과 문제 확인 후 해결까지 소요되는 시간을 점검
2)장애 및 보안 관리 데이터
-DB의 정상적인 상태 유지나 효과적인 사용을 방해하는 사건을 사전에 예방하거나 사건 발생시에 신속한 복구가 이루어지도록 하는 데이터
#기준(상복통)
*주기적인 상태 기록: 백업주기, 백업방법, 백업데이터의 안전한 보관과 정상적인 복구 여부의 관리
*복구 절차와 규칙: 복구 절차와 적용되는 규칙의 완전성
*접근통제: 사용자 관리와 사용자 접근권한의 관리
3)성능 관리 데이터
-DB의 성능을 향상시키는데 필요한 관리 데이터
#기준(점수)
*주기적 성능 점검: 성능 측정 기준과 측정 주기
*성능 향상 수단:성능향상을 위한 절차와 규칙
4)흐름 관리 데이터
-하나의 정보시스템 데이터를 다른 정보시스템으로 이동할 때 사용하는 소스 데이터와 타깃 데이터 간의 매핑 정보를 관리하는 데이터
#기준(안유정)
*안전성: 데이터 이동이 필요한 모든 소스와 타겟을 정의, 소스와 타깃간 매핑규칙 정의
*유효성: 매핑규칙 준수, 위배되는 데이터에 대한 클린징 규칙 정의
*데이터 정합성: 매핑규칙을 준수하여 데이터의 정합성 보장
5)품질 관리 데이터
-데이터의 정합성을 확보하고 데이터 품질의 유지, 개선을 위한 데이터
#기준(기주검개)
*품질기준: 데이터의 품질 기준 정의, 데이터의 중요도에 따라 등급부여
*품질 점검주기: DB성능과 데이터 품질 등에 대한 측정 주기 설정
*품질 검증 절차와 규칙: 정의된 품질 기준을 적용하기 위한 데이터 품질 검증 절차와 규칙
*품질 개선 절차: 측정된 품질 평가 결과를 반영하여 데이터의 품질을 향상시키고 고품질 데이터를 유지할 절차와 방법
1.5업무 데이터
가.정의 및 관리 목적
-기관이나 기업의 업무 및 비즈니스를 수행하는데 필요한 데이터
나.세부 관리 대상
-원천, 운영, 분석
1)원천 데이터
-운영 업무 데이터의 원천이 되는 현실세계의 데이터(일반 문서, PC에 저장된 데이터 파일 등)
#기준(보안신)
*보안성: 허용되지 않은 사용자에게 노출될 위험이 높음
*안전성: 재해발생시 데이터 손실률이 높고 손실된 데이터의 복구가 어려움
*신뢰성: 정확성과 신뢰성을 판단하기 위한 근거
2)운영 데이터
-기업 및 기관의 목표 달성을 위해 DB에서 저장, 관리하여 활용하는 데이터. 임시데이터는 제외
#기준(완일최정검사)
*정확성: 원천데이터와 동일하게 오류가 없음
*일관성: 용어 정의, 규정, 표준, 속성 정의, 데이터 형식등과 일치
*최신성: 가장 최근 형태로 갱신. 데이터 최신성 등급(매우중요, 중요, 보통) 부여
*완전성: 완전한 형태, 조직의 목표 달성을 위해 요구되는 충분한 데이터 보유
*사용용이성: 인터페이스, 도움말, 고객지원 기능 등 제공
*검색용이성: 원하는 데이터를 추출하기위한 검색 관련 제반 기능
3)분석 데이터
- 운영 데이터의 추출, 변환, 적재 등의 과정을 통해 생성되는 데이터
#기준(분마요 주통시비)
*분석주기: 운영데이터의 분석 및 변환 주기 결정
*마감기한: 분석용 데이터로 변환하기 위해 이용하는 운영 데이터의 특정 시점
*요약레벨: 요약 수준
*주제지향성: 주제 영역별로 분류
*통합성: 일관된 표준에 따라 분류
*시계열성: 다양한 시점별로 정의
*비휘발성: 검색위주의 데이터로 구성
2.데이터 구조 이해
2.1개념 데이터 모델
가.정의 및 관리 목적
-업무 요건을 충족하는 데이터의 주제 영역과 핵심 데이터 집합을 정의하고 관계를 정의한 모델
나.세부 관리 대상
-주제영역,핵심엔티티,핵심관계
1)주제영역
-업무상 친밀도가 높은 데이터 집합을 하나의 주제 영역으로 정의
#기준(원집업)
*원자성: 다른 주제영역의 엔티티나 관계의 영향을 받지 않은 엔티티 집합
*집중성: 단위 주제영역내의 엔티티와 관계는 단위 주제 영역 내에 집중
*업무지향성: 업무적 명확성을 나타내는 단수 단위로 명명
2)핵심 엔티티
-업무 영역 내에서 관리하고자 하는 데이터 집합
#기준(집식영사관)
*집합성: 두 개 이상의 속성과 두 개 이상의 데이터 인스턴스를 갖는 데이터 집합
*식별성: 하나 이상의 속성으로 엔티티의 데이터 인스턴스를 유일하게 구분
*영속성: 업무의 활동 주기에 따라 영속적으로 존재
*사용성: 업무 범위내에서 반드시 사용
*관계성: 다른 엔티티와의 관계가 존재
3)핵심 관계
-핵심 엔터티 간의 논리적인 관계를 나타낸 것
#기준(선형업)
*선택성: 관계는 필수와 선택을 구별
*형태성: 1:1, 1:M, MM
*업무지향성: 두 엔티티간의 상호 영향을 명확히 표현
2.2데이터 참조 모델
가.정의 및 관리 목적
-업무 영역별, 주제 영역별 표준 데이터 집합, 관리 항목들이 표기되어 재사용이 가능한 데이터 모델
나.세부 관리 대상
1)데이터 참조 모델
-재사용이 가능한 형태의 데이터 모델로 속성 단위, 엔터티, ERD, 전체 업무 영역 단위
#기준(범단표정이분)
*범용성: 범용적으로 다양한 업무 영역에서 참조
*단순성: 비즈니스의 복잡성을 나타낸 데이터 모델은 특정 업무에 국한될 가능성이 높음
*표준성: 데이터 용어는 상식적이고 일반적인 수준에서 이해가능한 용어 사용
*정확성: 참조의 성격
*정보이용성: 엔터티 간의 관계뿐만 아니라 엔터티와 엔터티 간의 정의, 엔터티의 데이터 관리 규칙, 속성 정의도 함께 저장
*분류성: 업무영역과 업종, 데이터 구조 각 단계와 데이터 참조모델의 범위내에서도 분류
2.3논리 데이터 모델
가.정의 및 관리 목적
-개념 데이터 모델을 상세화 하여 논리적인 데이터 집합, 관리 항목, 관계를 정의한 모델
-완전성: 다루는 대상에 대한 데이터 구조정의시 상세하게 정의될 수 있는 모든 정보를 포함
-구체성: 업무에서 다루는 모든 데이터 구조를 구체적으로 정의
-최신성:업무에서 다루는 모든 데이터 구조를 최신의 내용을 관리
나.세부 관리 대상
-주제영역,엔티티,관계,속성
1)주제 영역
-업무상 친밀도가 높은 데이터 집합을 하나의 주제 영역에서 선언
2)엔티티
- 개념 데이터 모델의 정의를 포함하고 이력 관리와 동질성, 독립성 정보가 보다 더 상세히 파악된 서브타입 정보가 추가 가능
#기준(완영식동화)
*완전성:두 개 이상의 속성과 두 개 이상의 인스턴스를 유지
*영속성:현재부터 미래까지 관리할 데이터 집합
*식별성: 엔티티의 인스턴스를 유일하게 구별할 수 있는 하나 이상의 속성 존재
*동질성: 동질의 데이터가 모인 데이터 집합
*정규화: 3차 정규화 권장
3)관계
- 개념 데이터 모델의 정의를 포함하고 상세 논리 데이터 모델 단계에서 모든 M:M 관계는 해소
#기준
*선택성: 필수, 선택
*관계형태: 1:1, 1:M, M:M
*관계명칭: 엔티티와 엔티티간의 관계 설정시 관계명 필수
4)속성
- 엔터티 내에서 관리하고자 하는 정보의 항목
#기준(원일무보)
*원자성: 의미있는 최소단위까지 분할, 하나의 속성은 한 상태의 정보만 포함
*일관성: 하나의 속성은 하나의 데이터 유형을 가리키며 하나의 데이터만 관리
*무결성: 참조되는 속성의 데이터는 해당 속성을 참조하는 속성의 데이터와 일치
*정보성: 업무와 관련해 의미 있는 범위 내에서 상세화의 수준이 결정
2.4물리 데이터 모델
가.정의 및 관리 목적
-논리 데이터 모델을 DBMS의 특성 및 성능을 고려하여 구체화시킨 모델
나.세부 관리 대상
-주제영역, 테이블, 관계, 컬럼
1)주제 영역
-분산 DBMS의 고려나 업무 영역에 따라 다른 스키마의 설계로 대응을 고려.
-논리 데이터 모델에서 정의한 주제 영역은 물리 데이터 모델에서 스키마나 서버로 분산될 수도 있으나 경우에 따라서는 하나의 서버에 하나의 스키마 내에서 테이블의 명명 관례에 의하여 물리적 주제 영역을 구분하여 관리 가능
2)테이블
-데이터의 물리적 특성과 DBMS의 특성에 따라 하나의 물리적 저장 장소인 테이블 혹은 서브타입이나 업무적 특성에 따라 하나 이상의 물리적 테이블로 분할 가능
#기준(영식)
*영속성: 현재부터 미래까지 관리
*식별성: 레코드들은 하나 이상의 컬럼 데이터에 의해 구별 가능
3)관계
-부모 테이블과 자식 테이블 간의 데이터 생성, 삭제, 변경 규칙을 정의
#기준(생변삭)
*생성규칙: 자식 테이블의 데이터 생성시 부모 테이블에 참조되는 데이터가 반드시 존재
*변경규칙: 부모 테이블의 키 데이터가 변경되면 참조하는 자식 테이블의 참조 데이터는 같이 변경되거나 혹은 자식 데이터가 존재하면 부모 테이블의 키 데이터는 변경 불가
*삭제규칙: 부모 테이블의 데이터가 삭제되면 해당 데이터를 참조하는 자식 테이블의 데이터가 함께 삭제되거나 혹은 자식 데이터가 존재하면 부모 테이블의 데이터는 삭제 불가
4)컬럼
-표준화된 도메인 내에서 업무 규칙이 반영된 데이터를 저장하도록 정의
-하나의 컬럼 데이터는 같은 데이터 유형
2.5데이터베이스
가.정의 및 관리 목적
-물리 데이터 모델을 구현한 결과물이며 구축된 실제 데이터가 저장되는 데이터 저장소
나.세부 관리 대상
-저장공간,테이블,제약조건,인덱스,트리거,DB링크,프로시저,뷰,동의어,Role
1)저장공간
-DB에서 데이터를 저장할 공간을 필요로 하는 테이블과 인덱스를 정의하는 영역
#기준(안보확성)
*안전성: 시스템의 다른 프로그램 수행 영역으로부터 분리되어 안전하게 보호
*보안성: 허가 받지 않은 프로그램이나 사용자에 대하여 접근 제어
*확장성: 저장 공간의 확장과 물리적 디스크 영역의 할당이 충분하고 편리하게 수행
*성능보장: 물리적 디스크는 빠른 성능을 유지할 수 있는 제품과 구조적 배치
2)테이블
-엔터티와 속성으로 정의
#기준(주다보논)
*주기성: 테이블내 데이터는 일정한 주기에 따라 백업되거나 성능을 위하여 재생성 가능
*다양성: 적절한 분산 전략과 테이블 저장 공간 정의 방식에 따라 파티션, 클러스터, 인덱스 구성 테이블 등 여러 형태로 정의
*보안성: 권한과 사용에 따라 제한된 범위의 사용자에게 테이블 단위, 칼럼 단위로 접근, 생성, 변경, 삭제 규칙 정의
*논리성: 테이블 추가와 칼럼 추가는 반드시 논리 데이터 모델을 참조하여 반영
3)제약 조건
-NOT NULL, DEFAULT, FOREIGN KEY CONSTRAINT, CHECK 조건 등의 비즈니스 규칙은 칼럼에 정의할 것을 권장하나 테이블 간의 관계 적용 제약 규칙은 애플리케이션과 병행하여 적용
*NOT NULL: 데이터가 반드시 존재
*DEFAULT: 데이터가 반드시 존재해야하는 컬럼의 기본값
*FOREIGN KEY: 물리 데이터 모델에서 정의한 관계의 입력, 삭제, 생성 규칙을 정의
*CHECK: 특정 칼럼에는 미리 정의한 데이터 종류 혹은 범위 내의 데이터만 존재하도록 정의
4)인덱스
-논리 데이터 모델에는 반영되어 있지 않으나 데이터의 접근 속도를 빠르게 하기 위한 데이터 저장소
5)트리거
-테이블과 연계되어서 미리 규정된 함수를 수행
6)DB link
-원격지에 있는 데이터베이스를 연결하여 한 곳의 서버에서 다른 서버에 있는 데이터를 하나의 SQL문 내에서 다룰 수 있음
7)프로시저
-프로그램 SQL 문으로 작성
8)뷰
-사용자가 정의한 SQL문의 수행 결과를 보여주는 가상 데이터 영역.
-중요한 데이터에 대한 접근 제한과 DB 복잡 완화,
-복잡한 데이터베이스 디자인 숨김,
-이질 데이터에 대한 분산 질의를 포함한 복잡한 질의 단순화,
-사용자 접근 관리 단순화
9)동의어
-테이블에 대한 별명
10)Role
-DB 객체에 대하여 생성, 삭제, 읽기 변경 권한에 대한 그룹을 생성
2.6사용자 뷰
가.정의 및 관리 목적
-데이터를 제공하는 정보시스템상의 화면이나 출력물
나.세부 관리 대상
1)화면
-정보시스템이 생성한 최종 산출물의 제공 인터페이스로 최종 사용자 화면과 시스템 관리자용 화면
#기준(편검지성)
*편의성: 모든 작업 절차는 직관적이고 편리해야함
*검색성: 원하는 정보를 신속 정확하게 검색
*지원성: 도움말 적절히 제공
*시스템 성능: 적정한 속도와 성능 유지
2)출력물
-정보시스템을 통해 생성되는 산출물.보고서, 장표, 전표 등과 같은 산출물은 물론 해당 출력물을 생성하는 응용 프로그램까지 포함
3.데이터 관리 프로세스 이해
3.1데이터 관리 정책
가.정의 및 관리 목적
-기업의 비전과 목표 달성에 필요한 데이터의 확보 계획과 확보된 데이터의 효과적인 운영 관리 체계 및 계획을 정의하는 작업
*DA의 역할
-사업계획을 바탕으로 데이터 확보계획을 정의
-확보된 데이터를 효과적으로 관리*유지하기 위한 체계를 정의
-DB 품질과 관련된 작업을 원활하게 수행하기 위한 교육체계를 수립
나.세부 관리 대상
-데이터 관리 원칙, 데이터 관리 조직, 데이터 관리 프로세스에 대한 체계 및 계획 을 수립
1)데이터 관리 원칙
-고품질 데이터 서비스를 지원하기 위한 관리기준, 조직, 프로세스에 대한 계획, 규정, 지침
-데이터의 효과적인 확보, 유지관리를 위해 수립된 규정이나 계획, 지침등에 포함된 데이터 관리방향
#기준(준불이완일)
*준수성: 기업의 비전과 목표에 맞는 데이터를 확보하고 데이터 관리 목적을 달성할 수 있도록 정의
*불가변성: 아키텍처 원칙 변화에 의한 불가피한 경우를 제외하고는 쉽게 바뀌지 않도록 정의
*이해성: 쉽게 이해할 수 있어야 하며, 의미가 불분명하여 발생하는 혼란을 최소화
*완전성: 정책 수립에 필요한 모든 사항을 정의
*일관성: 원칙간의 충돌이 없도록 정의하고, 충돌이 발생한 경우에는 분명한 의사결정을 할 수 있도록 명시
2)데이터 관리 프로세스
-고품질의 데이터를 지속적이고 안정적으로 서비스하기 위해 각 기관의 특성에 맞게 정의한 프로세스간의 연관 관계를 정의한 프로세스
#기준(준완상)
*준수성: 데이터 관리 원칙에 맞게 정의
*완전성: 각 기관의 기존 프로세스에 대한 특성을 고려하여 정의하고 정의된 메인 프로세스는 데이터와 관련된 모든 요소를 빠짐없이 정의
*상호운용성: 기존의 다른 프로세스(변화 관리, 프로젝트 관리 등)와 상호 연관관계가 명확하게 정의
3)데이터 관리 조직
-각 기관에서 정의한 데이터 관리 프로세스를 지원하고 담당할 담당자와 조직을 정의
#기준(명운)
*명확성: 담당자와 역할이 명확하게 정의
*운영성: 조직 구성원은 해당 역할 및 업무를 수행하는데 필요한 능력을 갖추어야 함
다.데이터 관리 프로세스
1)데이터 관리 프로세스(요구,변경,정책,표준,모델,흐름,DB,활용)
요구사항정의 | 비즈니스의 연속성 및 장애에 따른 위험성을 사전에 제거, 최소화하기 위해 사용자의 요구 사항을 수집·분석 |
변경계획 수립 | 기존 시스템의 변경이 필요한 변경 사항인지, 표준 변경 요소인지, 모델 변경 요소인지를 판단하고 해당 작업을 수행하기 위한 작업자 배정 및 일정 계획을 수립 |
데이터관리정책 수립 | 사업 계획에 기반을 둔 기업의 비전과 목표를 달성하기 위해 필요한 데이터 확보 계획과 확보된 데이터를 효과적으로 관리, 유지하기 위한 체계 및 계획을 정의 |
데이터표준 정의 | 해당 기관에서 사용되는 용어 및 도메인, 코드, 데이터 관련 요소에 대한 표준을 전사적으로 정의 |
데이터표준 변경 | 정의된 데이터 표준(단어 표준, 도메인 표준, 코드 표준, 데이터 관련 요소 표준)에 대한 신규 및 추가 요청을 반영 |
데이터표준 평가 | 해당 기관에서 전사적으로 정의한 용어, 도메인 및 코드 표준의 준수 현황을 평가 |
데이터모델 정의 | 신규 시스템 개발시에 데이터 모델링 작업을 통해 설계된 개념 데이터 모델, 데이터 참조 모델, 논리 데이터 모델, 물리 데이터 모델을 전사적으로 생성, 유지 |
데이터모델 변경 | 사용자 요구 사항에 적합한 서비스를 제공하기 위해 데이터 표준 및 참조 모델을 토대로 데이터 모델을 변경 |
데이터모델 평가 | 해당 기관에서 전사적으로 관리하고 있는 데이터 모델을 평가 |
데이터흐름 정의 | 원천 데이터(문서, Text, DB 등)를 수기로 생성하거나 추출, 변환, 적재, 가공을 통해 목표 데이터베이스에 저장하는 데이터의 라이프사이클을 통제, 관리 |
데이터흐름 평가 | 소스 데이터를 생성하여 타깃 데이터로 저장/관리되는 데이터의 정합성을 평가 |
데이터베이스 정의 | 데이터베이스를 안정적으로 운영, 유지하는데 필요한 정기적/비정기적 작업 |
데이터베이스 변경 | 요구 사항에 따라 변경된 데이터 모델을 토대로 데이터베이스를 변경 |
데이터베이스 평가 | 현재 설정된 데이터베이스의 객체에 지정한 제약 조건과 객체 유형을 확인하여 해당 규칙이 최적의 성능을 보장하고 데이터의 오류를 방지하기에 적합한지를 평가 |
데이터활용도 평가 | 데이터의 활용도를 높이기 위해 핵심 데이터를 수 집한 후 이를 대상으로 활용도 측정 기준을 마련하여 데이터의 활용도를 측정 |
데이터활용도 개선 | 데이터 활용도의 저하 원인과 데이터 품질이 충족 되지 못한 원인을 분석하여 개선 방안을 마련하고, 데이터 품질 개선 활동을 통해 데이터 활용도를 높이기 위한 작업 |
2)데이터 관리 정책 수립 프로세스(수검표)
데이터 관리 정책 수립 | 비즈니스나 IT의 환경 변화에 따라 데이터 관 리 정책의 수립 및 변경이 필요한 경우, 필요한 관련 자료를 수집하여 정책 자료를 작성 정책 작성 시에는 데이터 품질 관리 원칙에 대한 수립과 데이터 품질 관리 프로세스 정의, 담당자의 역할 정의 등의 내용 포함 |
데이터 관리 정책 검토 | 수립된 정책(안)을 토대로 CIO/EDA 및 관련 사용자, 관련 데이터 관리자 등이 참석하여 정책에 대한 완전성 및 일관성, 실현 가능성 등을 검토 하여 승인 처리 |
데이터 관리 정책 공표 | 확정된 데이터 관리 정책을 선포하고, 정책 변 경에 따른 데이터 관리 프로세스의 정의 및 수정이 필요한 경우 이를 수행 |
3.2데이터 표준 관리
가.정의 및 관리 목적
-데이터 표준화 원칙에 따라 정의된 표준 단어 사전 및 도메인 사전, 표준 용어 사전, 표준 코드, 데이터 관련 요소 표준 등을 기관에 적합한 형태로 정의하고 관리하는 작업
-표준의 적용은 신규 개발시점에서 이루어지고 기존 시스템과 중복 표준 허용 가능.
나.세부 관리 대상
-표준 데이터(데이터이해, 데이터구조이해에서 다룸)
#표준관리 조직 역할
조직 | 담당업무 |
데이터 관리 책임자 | 데이터 표준관리 정책 수립, 데이터 기능별 담당 관리자 배정, 데이터 관리 향상을 위한 전략 기획 등을 담당 |
데이터 표준 담당자 | 데이터 표준 품질 확보를 위해 데이터 표준 정의, 표준 사전 관리, 표준 검토 및 점검 등 데이터 표준관리 활동을 수행 |
DBA | 데이터베이스에 실제 적용 및 확인을 담당 |
데이터 구조 담당자 (개발자 또는 설계자) |
데이터 구조의 신규/변경 시 데이터 표준을 준수하여 모델에 적용 |
업무 담당자 | 업무상 필요한 데이터 구조 변경 요건을 데이터 구조 담당자(개발자 또는 설계자)에게 요청 |
다.데이터 표준 관리 프로세스
1)데이터 표준 관리 프로세스(요구,원칙,단어,데이터표준 정의,검토,공표, 변경요구,영향도,변경,공표)
표준화 요구 사항 수집 | 현업, 모델러, 및 사용자 뷰 운영자를 대상으로 데이터 표준과 관련된 요구 사항을 인터뷰와 설문지 조사를 통해 수집하고, 전사 데이터 표준 대상 후보를 추출하여 개선 방안을 도출 |
표준화 원칙 수립 | 현행 정보시스템에서 적용하고 있는 데이터 표준 원칙과 모델 데이터, 업무 데이터를 수집하여 현행 데이터 표준에 대한 개선 방안을 토대로 향후에 적 용할 전사 데이터 표준화 원칙을 수립 |
표준 단어 사전 정의 | 기존 모델 데이터 및 용어집을 통해 해당 기관에 서 사용되고 있는 모든 단어를 추출하여 정의된 표준화 원칙에 따라 한글명, 영문명, 영문 약어명 등을 정의하고 단어의 종류와 유형을 분류 |
표준 도메인 사전 정의 | 데이터의 물리적 데이터 특성과 사용 빈도, 업 무적 특성을 고려하여 정의된 표준화 원칙에 따라 도메인을 분류하고 도메인별 데이터 타입을 정의 |
표준 코드 정의 | 기존 모델 데이터를 통해 코드를 선별하여 현 코드집 에 누락된 코드 정보를 수집하고, 수집된 코드 정보와 표준화 원칙을 바탕으로 표준 코드를 정의 |
표준 용어 사전 정의 | 표준 단어, 표준 도메인, 표준 코드를 조합하여 정의된 표준화 원칙에 따라 표준 용어를 정의하고 용어의 설명을 수집 |
데이터 관련 요소 표준 정의 | 정의된 표준 데이터와 표준화 원칙을 바탕 으로 업무적 용도와 물리적 특성을 고려하여 데이터 관련 요소 표준을 정의 |
데이터 표준 검토 | 데이터 관리자가 정의한 표준 데이터가 업무적 용도 와 물리적 특성을 고려하여 표준화 원칙에 위배됨이 없이 정확하게 정의 되었는지를 확인하고 표준 예외 사항은 표준화 원칙에 피드백하여 처리 |
데이터 표준 공표 | 정의된 표준화 프로세스에 따라 전사 시스템에 표준 화 원칙이 적용 가능하도록 확정된 데이터 표준을 배포하고 표준 데이터 관리에 대한 이해 및 적용 을 위한 교육을 실시 |
변경 요구 사항 검토 | 요청된 표준 변경 요구 사항이 기존에 정의된 데 이터 표준을 사용해서도 처리 가능한 요건인지를 먼저 검토하고, 추가 및 변경이 필요하다고 판단 되는 경우에만 추가/변경 작업을 요청 |
표준 변경 영향도 평가 | 표준의 변경 시에 기존 테이블이나 컬럼에 영 향을 미치므로 해당 표준의 변경으로 인해 변경이 필요한 테이블 및 속성, 기타 요소들을 파악하고 해당 모델러에게 해당 작업을 요청 |
표준 추가 및 변경 | 표준 변경 요소에 대한 내역을 데이터 표준화 원칙 에 맞게 추가 및 변경한다. 변경 작업이 완료되면 변경된 사항을 토대로 영향도 평가 작업 및 공표 작업을 요청 |
표준 등록 및 공표 | 표준 추가 및 변경 작업을 통해 변경된 데이터 표 준 내역을 공표하여 향후 모델링 작업 및 데이터베이스 관리 작업 시에 활용 |
2)데이터 표준 개선 프로세스(매핑,준수,영향도,원인,정제)
데이터 표준 - 데이터 모델 매핑 | 용어 표준, 도메인 표준, 명명 규칙 표준을 데이터 모델(개념, 논리, 물리)에 반영 |
데이터 표준 준수 체크 | 데이터 표준과 데이터 객체(데이터 모델, DB객체) 간에 데이터 표준 준수 체크 |
변경 영향도 분석 | 앞선 체크 과정에서 데이터 표준 미준수 부분에 대한 영향을 분석 |
데이터 표준 미준수 원인 분석 | 실 데이터 값에 대해서 데이터 표준을 지키고 있는지를 체크하여 표준 미준수의 원인을 분석 |
데이터 정제 | 앞선 데이터 표준을 준수하지 않은 데이터에 대해서 여러 분석 작업을 통하여 데이터를 수정 |
표준 단어/용어/도메인 변경 프로세스
업무 요건 발생 | 업무 요건 변경으로 인하여 데이터 표준의 신규, 변경,삭제 요건이 발생한 경우 데이터 구조 담당자에게 해당 내용을 요청 |
데이터 표준 요건 접수 | 업무 부서에서 요청한 데이터 표준의 신규, 변경,삭제 요건을 검토 |
데이터 표준 조회 및 검토 | 기존 표준 데이터 목록 중 요건에 부합하는 표준 존재를 확인하여 신규, 변경, 삭제를 검토 |
변경 영향 협의 / 대안 수립 | 데이터 표준의 변경, 삭제가 불가능한 경우 관련 담당자와 협의하여 적절한 조치 |
표준 반영 및 배포 | 표준 검토 결과 승인된 결과에 대해서 DBA가 데이터베이스에 적용 및 배포 |
표준 코드 변경 프로세스
업무 요건 발생 | 업무 요건 변경으로 인하여 데이터 코드 신규, 변경, 삭제요건이 발생한 경우 데이터 구조 담당자에게 해당 내용을 요청 |
데이터 표준 코드 요건 접수 | 업무 부서에서 요청한 데이터 코드의 신규, 변경, 삭제 요건을 검토 |
데이터 표준 코드 조회 및 유효값 검토 | 기존 표준 코드 목록 중 요건에 부합하는 표준 코드 존재 및 통합 가능 여부를 검토 |
변경 영향 협의 / 대안 수립 | 표준 코드 변경, 삭제가 불가능한 경우 관련 담당자와 협의하여 적절한 조치 |
표준 코드 반영 및 배포 | 표준 코드 검토 결과 승인된 결과에 대해서 DBA가 데이터베이스에 적용 및 배포 |
데이터 표준 점검 프로세스
데이터 표준 진단 | 표준 진단 기법에 따라 데이터 표준 담당자가 데이터 단어, 용어, 도메인, 코드에 대한 품질을 확보하기 위하여 사후적 조치로 정기 점검을 실시 |
진단 결과 분석 | 표준 진단 결과에 대해 데이터 표준 담당자가 데이터 단어, 용어, 도메인, 코드에 대한 진단결과를 분석 |
데이터 표준 보완 | 표준 진단 결과에 따라 데이터 표준 담당자가 데이터 구조에 영향을 미치지 않는 범위를 우선적으로 식별하여 보완하고, 데이터 구조에 영향을 미치는 부분은 구조 변경 가능 여부에 따라 조치 |
데이터 구조 영향도 분석 | 데이터 표준 변경 작업 수행시 데이터 구조 변경이 가능하다고 판단되는 경우 데이터 구조 변경 검토 요청 |
데이터 구조 변경 검토 | 데이터 구조 변경 영향 여부에 따라 검토가 필요한 경우 데이터 구조 담당자에게 검토 요청 |
데이터베이스 반영 | 데이터 구조 변경 검토가 완료되고 변경이 가능한 경우 DBA는 데이터 구조 변경 데이터베이스에 반영 |
3.3요구 사항 관리
가.정의 및 관리 목적
- 데이터를 비롯하여 관련 애플리케이션 및 시스템 전반에 걸친 사용자의 요구를 수집하고 분류하여 반영하는 작업
나.세부 관리 대상
-외부인터페이스/기능/성능/보안 개선 요건
1)외부 인터페이스 요건(중표)
-외부 기관이나 외부 시스템과의 사이에서 발생되는 모든 입/출력에 대한 요건
#기준
*중복성: 동일한 형태의 인터페이스가 중복정의되지 않도록 정의
*표준준수도: 국제 표준 및 국가 표준이 존재할 경우 그에 적합한 형태로 제공
2)기능 개선 요건(불범)
-애플리케이션에서 입력 발생되는 출력에 대한 요건
#기준
*불가변성: 기능 개선 요건이 향후에 재변경되지 않도록 근본적인 개선 방안을 요청
*범용성: 많은 사용자가 편리하게 사용할 수 있는 요건을 우선적으로 요청
3)성능 개선 요건(실측)
-해당 기관의 사용자가 필요로 하는 성능 개선 사항
#기준
*실현가능성: 해당 성능 개선 요구 사항이 현행 기술 수준과 서비스 특성을 고려할 때 구현 가능한 요건인지를 확인한 후 제시
*측정가능성: 측정이 불가능한 모호한 형태로 요건이 제시되면 안됨
4)보안 개선 요건(불실)
-중요 데이터에 대한 훼손, 변조, 도난, 유출에 대한 물리적 접근 통제(제한 구역, 통제 구역 등) 및 사용 통제(인증, 암호화, 방화벽 등)에 대한 요건
#기준
*불가변성: 보안 개선 요건이 향후에 재변경되지 않도록 근본적인 개선 방안을 요청
*실현가능성: 해당 보안 개선 요구 사항이 현행 기술 수준과 서비스 특성을 고려할 때 구현 가능한 요건인지를 확인한 후 제시
다.요구사항 관리 프로세스(요청,수렴,검토,영향도,공식화,계획)
-‘데이터 요건 분석’과목에서 다루는 내용과는 차이가 있음.
- ‘데이터 요건 분석’과목에서의 요건 분석은 사전 요구 사항 분석을 의미하며,
여기서는 사후 요구 사항 변경 관리를 의미
변경 요청 | 사용자가 해당 기관의 시스템을 활용하면서 발생하는 외부 인터페이스 및 기능, 성능, 보안 등의 요건을 요구 사항 변경 신청서를 통해 변경 요청 |
요구 사항 수렴 | 사용자로부터 요청된 변경 요청서를 수집하여 변경 신 청서 작성 규칙에 맞게 정확하게 정의했는지를 확인하고 해당 요건을 검토할 처리담당자를 지정 |
요구 사항 검토 | 요청된 요구 사항과 관련된 자료 및 기준, 시스템 등을 확인하여 처리 가능 여부를 판단하고 처리 가능한 경우에 데이터 관리자를 통해 공식화를 요청 |
변경 영향도 분석 | 변경 요청된 내역을 토대로 변경에 따른 영향이 미 치는 설계서 및 애플리케이션, 데이터베이스 등을 도출하고, 그 결과로 변경 영향도 분석서를 작성 |
공식화 | 영향도 분석을 통해 변경 처리가 요구되는 관련 담당자를 소집하여 공식화를 하고 해당 담당자들과의 협의를 통해 승리 방식은 규모 및 기간, 시급성에 따라 결정되며, 처리 방법은 신규 시스템 개발 방식과 기존 시스템 변경 방식 |
변경 작업 계획 수립 | 영향도 평가서를 통해 관련된 업무 영역 및 관련 시스템 내역을 토대로 작업 일정 계획을 수립 |
3.4데이터 모델 관리
가.정의 및 관리 목적
-데이터 요구 사항 관리에 의해 변경되는 데이터 구조를 모델에 반영하는 작업 절차와 데이터베이스 시스템 구조와 동일하게 데이터 모델을 유지하도록 하는 작업 절차
나.세부 관리 대상
-DRM, 개념/논리/물리 데이터 모델(2장 데이터 구조이해에서 다룸)
데이터 모델관리 조직 역할
#역할
조직 | 담당업무 |
데이터 관리 책임자 | 품질 관리 기능별 상호 연관성을 고려하여 데이터 구조 품질 확보를 위한 전략을 수립하고 세부 수행을 위한 검토 및 승인 처리를 담당 |
데이터 구조 담당자 | 기업의 데이터 구조 설계자가 여러 명인 경우 상위 수준의 주제영역 및 개념데이터 모델을 관리하고, 주기적인 데이터 모델 점검을 통해 DBMS와 데이터구조 간의 차이를 분석하여 개선하는 등의 모델 검토 및 점검을 수행 |
DBA | 데이터베이스에 테이블 등 데이터베이스 객체를 생성하고 관리하는 담당자로, 데이터 구조 담당부서 또는 데이터 구조 담당자의 대상 DBMS에 DB 객체를 생성 및 변경하며 DB 계정을 관리하고 접근권한 통제 정책을 수립 |
다.데이터 모델 관리 프로세스
1)데이터 모델 관리 프로세스(DRM,개념,논리,물리,개변,논변,물변)
개념 데이터 모델 정의 | 각 기관의 비전을 수립하는 데 필요한 데이터 주제 영역을 정의하고, 세부적인 내역보다는 전사 정보를 중복되지 않고 확장성 있게 설계 |
데이터 참조 모델 정의 | 업무 영역별, 주제 영역별 표준 데이터 집합, 관리 항목들이 표기되어 재사용이 가능한 데이터 모델을 정의하는 작업 |
논리 데이터 모델 정의 | 비즈니스 규칙을 토대로 업무의 모든 데이터 구조를 상세하고 구체적으로 정의한 모델로, 데이터 참조 모델 및 데이터 표준을 참고하여 설계 작업을 수행 |
물리 데이터 모델 정의 | 논리 데이터 모델 및 데이터 표준을 기준으로 대상 데이터베이스의 물리 특성을 고려하여 최적의 성능이 발휘될 수 있도록 상세한 설계 작업을 수행 |
개념 데이터 모델 변경 | 사용자 요구 사항의 특성에 따라 모델 변경 요 청 및 표준에 대한 변경 요청으로 분리 |
논리 데이터 모델 변경 | 개념 데이터 모델이 변경되거나 개념 데이터 모델의 변경이 없는 작은 규모의 변경(주제 영역 내의 인터페이스 조정 및 엔터티 타입의 변경, 엔터티 타입 간의 관계 변경, 속성 변경)이 요청된 경우, 또는 데이터 표준이 변경된 경우 논리 데이터 모델의 변경 작업이 수행 |
물리 데이터 모델 변경 | 변경 요청된 내역을 논리 데이터 모델 및 데이터 표준, 데이터베이스의 물리 특성 등을 참고하여 최적의 성능을 발휘할 수 있도록 물리 데이터 모델 변경 작업을 수행 |
2)데이터 모델 개선 프로세스(개논매핑,논물매핑,물D매핑,개논얼,논물얼,물D얼)
개념-논리 데이터 모델 매핑 | 개념적으로 생성된 데이터 집합 또는 관리 항목과 논리 데이터 모델 사이의 구조적 정렬 정보를 생성하는 작업 |
논리-물리 데이터 모델 매핑 | 비즈니스 규칙을 토대로 업무의 모델 데이터 구조와 이를 바탕으로 데이터베이스의 물리적인 특성을 고려하여 정의한 물리 데이터 모델 간의 구조적 연결 정보를 설정 |
물리 데이터 모델-DB 매핑 | 물리 데이터 모델(최종 설계 도면)과 DBMS 카탈로그(건축물) 정보와의 구조적 연결 정보를 설정 |
개념-논리 데이터 모델 얼라인 분석 | 개념 데이터 모델에 정의된 모델이 실제 논리 데이터 모델에 구체적으로 정의되지 않은 모델이 존재하는지를 체크하는 등의 차이 분석 작업 |
논리-물리 데이터 모델 얼라인 분석 | 논리 데이터 모델과 물리 데이터 모델 사이의 차이를 분석 |
물리 데이터 모델-DB 얼라인 분석 | 물리 데이터 모델과 실제 DB와의 차이를 분석 |
주제영역 관리 프로세스
데이터 주제 영역을 추가하거나 기존 주제 영역을 삭제 또는 수정하는 업
주제영역 변경 요청 | 데이터 주제영역을 추가·삭제·수정하는 업무로, 주제영역 분류체계 및 데이터 중심의 분류 원칙에 따라 주제영역을 생성·삭제하며, 주제영역 명, 주제영역 코드 등의 관리 항목에 대해 수정 |
주제영역 변경 검토 및 승인 | 변경 요청된 주제영역의 적정성을 검토하여 승인/불가 처리를 수행 |
주제영역 변경 확정 및 반영 | 주제영역 변경 검토에 따라 승인된 결과를 주제영역 정의서 또는 보유 중인 표준 관리 시스템에 변경사항을 반영. 변경된 주제영역이 테이블명의 생성·삭제에 영향을 주는 경우 DBA에게 관련 사항 통보 |
개념 데이터 모델 관리 프로세스
-데이터 주제 영역 추가/삭제 및 핵심 엔터티의 변경 시 개념 데이터 모델의 변경 관리가 필요하며, 개념
데이터 모델 관리 프로세스는 개념 데이터 모델에 대한 변화 관리를 위한 프로세스
개념 데이터 모델 변경 요청 | 기업의 업무 요건 변화에 따라 개념 데이터 모델의 신규, 변경, 삭제 요건을 요청 |
개념 데이터 모델 검토 및 승인 | 작성된 개념 데이터 모델에 대해 데이터 관리 책임자의 검토 및 승인 처리를 수행 |
개념 데이터 모델 확정 및 반영 | 데이터 관리 책임자의 보완 요청 사항을 반영하여 기업의 개념 데이터 모델을 확정하고, 개념 데이터 모델 관리를 위한 산출물 또는 보유중인 표준 관리 시스템에 반영 |
논리/물리 데이터 모델 관리 프로세스
-논리/물리 데이터 모델 관리 프로세스는 요구 사항을 분석하여 논리와 물리 데이터 모델의 생성·변경·삭제가 발생하게 되는 경우 데이터 모델의 변화 관리를 수행하는 프로세스
논리/물리 데이터 모델 변경 요청 | 업무 요건 변경에 따라 필요 속성(칼럼) 및 관계 등을 정의하여 데이터 표준 담당자에게 데이터 표준 검토 및 반영을 요청 |
데이터 표준 검토 및 반영 | 데이터 모델 설계에 따라 단어, 용어, 도메인 정의가 데이터 표준에 맞게 적용되었는지 확인 |
논리/물리 데이터 모델 검토 및 승인 | 논리와 물리 데이터의 특성에 맞게 검토를 수행. 논리 데이터 모델은 논리적인 관점에서 엔터티 간의 관계 적정성, 중복 여부, 정규화 위배 등을 검토하고, 물리 데이터 모델은 물리적인 관점에서 적용 -데이터베이스의 특성 및 데이터 성능에 문제점이 없는지에 대해 상세하게 검토 후 승인 |
논리/물리 데이터 모델 확정 | 최종 모델이 확정되는 과정이며, 주요 산출물로는 논리 다이어그램과 물리 다이어그램 |
객체(테이블) 생성 | 대상이 되는 데이터베이스에 DB 객체 생성 권한이 있는 DBA가 처리 |
데이터 모델 점검 프로세스
논리-물리 데이터 모델 매핑 | 비즈니스 규칙을 토대로 업무의 모델 데이터 구조와 이를 바탕으로 데이터베이스의 물리적인 특성을 고려하여 정의한 물리 데이터 모델 간의 구조적 연결 정보를 설정 |
물리-DB 데이터 모델 매핑 | 물리 데이터 모델(최종 설계 도면)과 DBMS 카탈로그 정보와의 구조적 연결 정보를 설정 |
논리-물리 데이터 모델 얼라인 분석 | 논리 데이터 모델과 물리 데이터 모델 사이의 차이를 분석 |
물리-DB 데이터 모델 얼라인 분석 | 물리 데이터 모델과 실제 DB와의 차이를 분석 |
점검 결과 취합 및 보고 | 데이터 구조 담당자와 DBA가 수행한 데이터 모델 점검 결과를 취합 및 보고 |
점검 결과 검토 및 승인 | 데이터 모델 점검 결과에 대해 검토 및 보완 사항을 확인 후 변경 영향도 분석에 따라 데이터 모델 및 데이터베이스 변경을 수행 |
3.5데이터 흐름 관리
가.정의 및 관리 목적
-소스 데이터(문서, Text, DB 등)를 수기로 생성하거나 추출, 변환, 적재를 통해 생성하여 타겟 데이터베이스에 저장·가공하는 것을 관리하는 절차
나.세부관리 대상(원본이 잘못됨)
-데이터추출, 변환, 적재
#데이터 흐름 관리 방법
~소스 데이터와 타깃 데이터 간의 매핑 리스트를 작성하고, 타깃 시스템에서 필요로 하는 소스 데이터가
모두 포함되어 있는지 확인
~ 데이터 이동이 필요 없는 소스와 타깃의 매핑 여부를 검사
~삭제된 소스를 매핑 소스로 사용하고 있는지를 검사
~ 소스와 타깃의 데이터 구조가 동일한지 조사, 동일하지 않은 경우 변환 규칙을 적용하고 있는지 조사
~ 변환 규칙이 데이터 무결성 규칙을 준수하는지 검사. 그 결과가 데이터 정합을 보장하는지 검사
다.데이터 흐름 관리 프로세스
1)데이터 흐름 관리 프로세스 (요건,분석,설계,테스트,검증,모듈반영,모니터링,점검기준,점검지표,정합성,오류,영향도,정제)
데이터 추출(변환) 요건 검토 | 현업 업무를 위해 사용자로부터 접수한 요구 사항 중에서 데이터를 추출(변환)하여 해당 데이터베이스에 적재해야 하는 요건을 검토 |
소스 데이터 분석 | 모델러는 소스 데이터를 추출(변환)하여 해당 데이터베이스에 적재하기로 결정된 요건에 대해 소스 데이터 관점에서 해당 테이블 및 컬럼에 대한 내용을 분석 |
소스 데이터 추출(변환) 설계 | 모델러는 소스 데이터의 변환 로직 및 적재 로직을 설계 |
소스 데이터 추출(변환) 테스트 | 모델러는 추출(변환) 설계에 따라 소스 데이터를 테스트 형식으로 타겟 데이터베이스에 적재 |
소스 데이터 추출(변환) 검증 | 사용자는 소스 데이터 추출(변환) 테스트에서 작성된 대상 내용을 바탕으로 해당 요건이 타깃 데이터베이스에 정확하게 반영되어 데이터가 적재되었는지를 확인 |
소스 데이터 추출(변환) 모듈 반영 | 데이터베이스 관리자는 사용자의 검증이 완료된 소스 데이터 추출(변환) 변화를 운영 환경으로 적용 |
소스 데이터 추출(변환) 모니터링 | 모델러는 운영 환경에 적용된 소스 데이터 추출(변환) 모듈을 정해진 규칙에 따라 주기적으로 모니터링하여 그 결과를 데이터 관리자에게 보고 |
데이터 흐름 점검 기준 도출 | 데이터 오류를 최소화하기 위해 지속적으로 품질 점검을 통해 관리되어야 할 기준을 도출 |
데이터 흐름 점검 지표 생성 | 앞선 데이터 흐름 점검 기준별로 구체적인 데이터 흐름의 정합성을 체크할 수 있는 지표들을 도출 |
데이터 정합성 체크 | 앞선 지표에 따른 구체적인 체크 모듈을 실행하여 정합성을 체크 |
오류 데이터 분석 | 데이터 정합성 검증을 통하여 추출된 오류 데이터에 대한 분석을 수행 |
변경 영향 분석 | 앞선 체크 과정에서 오류 데이터의 원인에 대한 분석 을 통하여 구체적으로는 데이터 표준을 변경할 때의 영향, 데이터 모델을 변경할 때의 영향, 데이터베이스 객체를 변경했을 때의 영향 등을 분석 |
데이터 정제 | 데이터 정합성을 지키지 않은 오류 데이터의 원인 분석 결과에 따라 데이터 관리의 각 요소에 적절한 조치를 수행하고, 데이터 값을 수정 |
3.6데이터베이스 관리
가.정의 및 관리 목적
-원활한 데이터 서비스를 위해 필요한 데이터베이스를 안정적으로 운영, 관리하는 데 필요한 작업을 체계화
나.세부 관리 대상(원본 오류)
다.데이터베이스 관리 프로세스
1)데이터베이스 관리 프로세스 (생성,스케줄,백업,보안대상,보안적용,보안교육,성능개선,보안개선,복구,변경,이관)
데이터베이스 생성 | 비즈니스 요건에 맞게 설계된 데이터 모델을 토 대로 작성된 DDL문을 가지고 데이터베이스의 물리 특성을 고려하여 데이터베이스를 구성 |
백업 주기 및 스케줄 정의 | 어떠한 장애가 발생되더라도 사용 중인 데 이터의 완전 복구가 가능하도록 백업 주기 및 스케줄이 정의 |
데이터베이스 백업 수행 | 백업 주기별 스케줄 표를 참고로 하여 백업을 수행 |
데이터 보안 대상 선정 | 보호되어야 할 자산의 파악 및 가치에 대한 평가 작업을 수행하고, 시스템에 존재하는 취약점 및 위험 요인에 대한 분석 작업을 수행 |
데이터 보안 적용 | 보안 관리 대상별 중요도에 따른 보안을 적용하는 작업으로, 물리적 접근 보안 및 네트워크 보안, 서버 및 운영체제 보안, 데이터베이스 보안, 응용시스템 보안, PC 보안 등 종합적인 보안 적용 필요 |
데이터 보안 교육 수행 | 기관별로 수립된 데이터 보안 정책을 년 1회 이상 전 구성원을 대상으로 실시해야 하며, 교육 평가 작업 등을 통한 고품질의 교육이 될 수 있도록 체계화 |
데이터베이스 성능 개선 | 해당 기관의 사용자가 필요로 하는 성능 개선 사항 |
데이터 보안 개선 | 중요 데이터에 대한 훼손, 변조, 도난, 유출에 대 한 물리적 접근 통제(제한 구역, 통제 구역 등) 및 사용 통제(인증, 암호화, 방화벽 등)에 대한 요건 이 발생되었을 경우 보안 장치를 개선하는 작업 |
데이터베이스 복구 | 장애 등으로 인해 데이터에 대한 전반적인 훼손 및 에러로 인해 기존 백업된 데이터로의 복구 작업 |
테스트 데이터베이스 변경 | 변경 요청에 의해 제시된 요건에 따라 변 경된 데이터 모델을 토대로 작성된 DDL문을 가지고 데이터베이스의 물리 특성을 고려한 테스트 데이터베이스를 변경된 데이터 모델과 동일한 형태로 변경하는 작업 |
운영 데이터베이스 이관 | 테스트 데이터베이스에 변경된 내역을 토대로 해당 애플리케이션에 대한 문제점을 확인하는 단위 테스트와 타 애플리케이션과의 인터페이스 를 테스트하는 통합 테스트, 사용자의 만족도를 확인하는 사용자 테스트 등을 수행한 후 안정성 및 정확성이 확보되면 운영 데이터베이스에 해당 변경 내역을 반영 |
2)데이터베이스 개선 프로세스(효율성,원인,영향도)
DB객체 관리 효율성 체크 | 현재 설정된 데이터베이스의 객체에 지정한 제약 조건과 객체 유형을 확인하여 최적의 성능을 보장하고 데이터의 오류를 방지하기 위한 객체 관리 규칙들인지 평가 |
비효율 원인 분석 | 현재 설정한 객체 관리 유형이나 객체 유형이 비효율적 성능을 보인다면 해당 원인을 분석 |
변경 영향도 분석 | 비효율을 개선하기 위하여 DB내에서 제약 조건이나 객체 유형을 변경할 수도 있으나 테이블의 통합/분리의 변경이 요구된다면 물리 데 이터 모델의 변경이 요구 가능 |
3.7데이터 활용 관리
가.정의 및 관리 목적
-데이터의 활용 여부를 점검하거나 활용도를 높이기 위해 측정 대상 데이터와 품질 지표를 선정하여 품질을 측정하고 분석하여 품질을 충족시키지 못하는 경우, 원인을 분석하여 담당자로 하여금 조치하도록 하는 작업
나.세부 관리 대상
1)핵심 데이터(최완일유명유)
-회사의 고객, 프로세스, 시장 환경, 재무 정보 등에 직접적으로 영향을 미치는 중요성이 높은 데이터
-해당 테이블의 컬럼수준으로 관리.
#기준
*완전성:데이터의 모든 값은 의미 있게 채워져야 함.
*일관성:데이터의 값은 동일하게 관리
*최신성:데이터의 값은 실제 세계의 객체들이 가지고 있는 값과 같아야 함
*유효성:데이터의 값은 업무 규칙을 준수
*유일성:데이터의 값은 동일 테이블에서 중복 관리되어서는 안됨
*명확성:데이터의 의미가 혼동되지 않도록 분명해야 함.
2)측정 방법
-데이터의 업무적인 규칙 및 물리적 특성(도메인, 유효성 등)을 반영한 데이터 품질 측정 기준
#역할
조직 | 담당업무 |
데이터 관리 책임자 | 데이터 활용 관리 업무를 총괄하며, 데이터 활용도 측정을 위해 활용 관리 계획 및 목표를 수립 |
데이터 활용 담당자 | 데이터 활용도 측정 기준에 따라 활용 측정 및 요인을 분석 활용도 측정을 위해 핵심 또는 관련데이터 수집, 활용 측정, 활용 저하 요인 분석 등의 업무를 수행 |
DBA | 데이터 활용도 측정을 위한 기술적인 부분을 담당하며, 데이터 활용 담당자가 데이터 활용자료 요청 시 해당 자료를 제공해주는 역할을 수행 |
다.데이터 활용 관리 프로세스
1)데이터 활용 관리 프로세스(핵심,측정기준,측정,요인분석,개선방안,수행,평가)
핵심 데이터 수집 | 개선 대상이 되는 데이터를 선정 기준에 따라 선정 하고, 업무부하 및 시스템 부하를 고려하여 측정 데이터량을 조정 |
데이터 활용도 측정 기준 수립 | 데이터별 활용도 측정 기준을 정량적으 로 마련하고 데이터 활용 개선 목표치를 설정하여 향후 개선 작업에 대한 평가 작업 수행 시 활용 |
데이터 활용 측정 | 데이터 활용도 측정 기준에 따른 활용도 평가 작업을 수행하고, 데이터 활용도 측정 결과서를 작성 |
활용 저하 요인 분석 | 데이터 활용의 저하를 유발한 비즈니스적, IT 적 원인을 데이터의 생성, 갱신, 변환, 활용 관점에서 도출하고, 데이터 활용 저하 원인 분석서를 작성 |
개선 방안 마련 | 활용 저하 원인별로 개선 방안을 마련 |
개선 활동 수행 | 승인된 개선 방안과 원인별로 도출된 개선 방안의 활동 계획에 따라서 개선 활동을 추진 |
개선 활동 평가 | 개선 활동을 평가하는 과정으로, 측정 목표치를 초과한 데이터에 대해서는 개선 항목에서 제외시키거나 목표치를 조정 |
*사용자 활용 관리
-사용자의 요구에 적합한 형태의 서비스를 제공하고 있는지에 대해 확인함으로써 고객의 서비스 만족을 도모하는 작업으로 서비스 만족에 대한 검토는 신규 시스템 개발 내역과 변경 처리내역뿐만 아니라 서비스 되는 모든 시스템에 대한 분석이 정기적/비정기적인 계획을 통해 이루어져야 한다.
====2021 교재 추가 내용
데이터 품질 관리 프레임워크
-데이터 표준, 데이터 모델, 데이터 값, 데이터 활용 등의 4가지 영역으로 구분
-데이터 표준은 표준 단어, 표준 용어,표준 도메인, 표준코드 등으로 구성
-데이터 모델은 모델링 도구를 활용하여 개념모델, 논리모델, 물리모델, DB Catalog로 구성
-데이터 값은 데이터 품질 지표(DQI), 핵심 정보(CTQ), 기술적 분석의 데이터 프로파일링, 비즈니스적 분석의 업무규칙으로 구성
-데이터 활용은 원천데이터와 타겟데이터의 데이터 매핑 정보, 데이터의 연관 관계, Map 형태의 데이터 흐름으로 구성
3.8 데이터 값(Value) 품질관리 프로세스
1. 정의 및 관리 목적
데이터 값에 대한 신뢰성, 정확성 확보를 위해 데이터 값 관점의 품질 진단 및 개선을 위한 절차로 오류데이터의 유입을 방지하기 위한 작업 절차
2. 세부 관리 대상
세부 관리 대상으로 값 관점 데이터 품질이 있음.
#품질 기준
· 품질 관리 대상 : 품질 측정 대상 시스템 및 테이블 관리
· 데이터 품질 지표 : 완전성, 유효성, 일관성, 정확성
· 핵심 정보 항목 : 가장 중요한 데이터 정보 항목(예시 : 고객연락처정보, 매출정보 등)
#프로파일링
-데이터 현황 분석을 위한 자료 수집, 데이터 통계, 패턴 등을 수집하여 잠재적 오류 징후를 발견하는 방법
-기법: 칼럼 프로파일링, 싱글 테이블 프로파일링, 크로스 테이블 프로파일링
#프로파일링 분석기법
분석기법 | 설명 |
칼럼 분석 | 칼럼 속성에 대한 준수 여부 검증(Mmn/Max, Null/Space) [측정 가능 도메인 예시] · 여부 - 여부, 유무 칼럼은 'Y', 'N' 값을 가진다. · 금액 가입금액은 0보다 크고 1,000,000보다 같거나 작아야 한다. · 수량 - 재가입횟수는 0보다 크고 5보다 같거나 작아야 한다. · 율 - 지분율은 0보다 크고 100보다 같거나 작아야 한다 |
패턴 분석 | 데이터를 구성하는 값에 대한 패턴을 분석 [측정 가능 도메인 예시] · 번호 - 주민등록번호는 숫자 13자리로 구성되어야 한다. 우편번호는 숫자 5자리로 구성되어야 한다. |
날짜 분석 | 데이터 타입은Character이나 의미상 날짜/시간 유형 데이터에 대한 유효성 분석 [측정 가능 도메인 예시〕 · 날짜 - 결혼일자는 'YYYYMMDD'의 유효한 날짜이어야 한다. |
코드 분석 | 칼럼 내 코드 값이 정의된 표준에 따라 구성되었는지를 검증 [측정 가능 도메인 예시] 코드 - 고객등급코드는 통합코드 코드ID = 'A00l' 코드 데이터와 일치해야 한다 |
참조무결성 분석 | 부모-자식 관계 데이터의 참조무결성 분석 [측정 가능 도메인 예시] 번호 고객주소정보의 고객번호는 고객원장에 반드시 존재해야 한다. |
#업무 규칙
-데이터 사용자가 요구하는 수준을만족시키기 위하여 업무적으로 규정된 기준에 맞도록 데이터 값을 관리
하기 위한 조건에 대한 일반적인 표현
· Inside-Out 도출 방법 : 데이터의 통계적인 분석(Data Profiling, Master Data 분석 등)을 통하여 오류데이터 잠재원인을 파악하고 업무규칙을 도출하는 방법. 업무적인 지식이 없는 경우에도 오류 징후를
발견하고 Low-Level의 필수성, 유효성 등의 업무규칙을 자동으로 생성 가능
· Outside-In 도출 방법 : 비즈니스 이슈, 외부고객의 소리-VOC(Voice Of Customer), 내부고객의 소리-VOB(Voice Of Business), 설문조사, 인터뷰 등의 분석을 통하여 오류 잠재원인을 파악하고 업무규칙을 도출하는 방법
· 근거규정 도출 방법 : 기관의 법령을 기초로 설계된 데이터 모델을 기준으로 표준 데이터 항목에 대하여
관련 규칙(업무정의, 근거규정 등)을 통합하여 서술적 업무규칙을 작성하고 매핑되는 실제 운영 시스템
칼럼의 데이터 품질 검증을 위한 업무규칙을 생성 가능
#품질 측정
진단 대상으로 선정된 데이터에 대하여 설정되어 있는 프로파일링, 업위규칙 등을 지속적, 정기적으로
수행하기 위해 데이터베이스 성능과 측정가능 시간 등을 고려하여 측정 주기(일일/주간/월간/분기/반기/연간 점검)를 설정. 품질 점검 주기는 사용자의 요구 수준을 반영하여 결정
#품질 개선
오류추정 데이터에 대해 개선 담당자, 오류 원인, 개선내용 등을 지속적으로 관리할 수 있도록 절차와
방법을 정의
값 관점 품질 측정 방법
측정기준 : 프로파일링, 업무규칙을 통해 값에 대한 품질을 측정
측정산식:
오류율(%) = 오류 데이터 건수 / 진단대상DB 전체 데이터 건수 x 100
=====
#데이터 값 관리 조직 역할
조직 | 담당업무 |
데이터 관리 책임자 | 데이터 품질 관리 업무를 총괄하며, 데이터 값에 대한 품질 확보를 위해 계획 및 목표를 수립 |
데이터 품질 담당자 | -데이터 품질을 진단하고 상시 발생하는 품질 오류를 개선하며, 품질 관련 이슈발생 시 관련 조직과의 의사소통 채널 역할을 수행 -주요 업무로는 데이터 값 진단 및 개선 계획 수립, 프로파일링, 업무규칙 진단 등 데이터 품질 진단, 품질 관리 관련 의사소통, 접수된 데이터 오류 개선방안 수립 및 개선 등의 업무를 수행 |
DBA | 데이터 값 진단을 위한 기술적인 부분을 담당하며, 데이터 품질담당자와의 협업을 통해 데이터 값 진단 수행, 업무규칙 등록 및 모니터링 등의 업무를 수행 |
4. 데이터 값 품질 관리 프로세스
가. 데이터 값 품질 관리 체계도
나. 데이터 값 품질 진단 프로세스
-오류데이터 유입을 방지하기 위해 데이터의 신뢰성, 정확성 확보를 위해 지속적으로 수행하기 위한 프로세스로서 크게 데이터 값 품질 진단 계획 수립 프로세스와 데이터 값 품질 진단 실시 프로세스
1) 데이터 값 품질 진단 계획 수립 프로세스
진단 계획 검토 | 데이터 값 진단 계획 관련 자료를 수집하고 검토하는 과정이며, 업무부서의 담당자 및 관련자들과 협의 및 검토를 추진하는 작업을 수행 |
진단 수요 분석 | 데이터 값 품질 진단 대상 DB 파악을 위해 품질 오류 신고 내용, DB 개선 수요, 품질 이슈 개선 수요 등을 분석하고 파악 |
진단 대상 선정 | 수요조사 결과를 분석하여 식별된 DB 중 데이터 값 진단의 중요성, 시급성 관점에서 1차 진단 대상을 선정하고, 중요 마스터 영역, 중요 트랜잭션 영역, 공통 영역 등으로 데이터를 구분하여 2차 진단 대상을 선정 |
진단 방향 수립 | 품질 이슈에 대한 다양한 수요 분석 결과를 바탕으로 도메인 (날짜, 코드, 비율 등)과 업무규칙 기반의 프로파일링 기법을 적용하여 구체적인 진단 방향을 정의 |
진단 일정 및 계획 수립 | 진단 목적, 수행 방법 및 절차, 일정, 이해당사자 역할 및 책임, 소요 예산 등을 포함하여 진단 추진 계획을 수립 |
진단 추진 계획 승인 | 데이터 품질 담당자가 수립한 계획에 대해서 항목별 목적 달성 여부를 검토하고 승인 |
2) 데이터 값 품질 진단 실시 프로세스
프로파일링 기준 제시 | 데이터 값 진단을 위한 지침 및 방식에 대해서 기준을 마련 |
도메인 분석 | 대상 업무의 주요 엔터티 전체를 분석 대상으로 선정하고 엔터티에 대해 프로파일링 대상별 도메인 분석을 실시 -칼럼 분석은 데이터의 타입(Type), 길이(Length), 식별자(PK) 여부, 칼럼 속성 정의 등 기준항목(예 :상태, 여부, 구분, 결과, 유형, 유무 등)이 분석 대상. -비정형패턴 분석은 특정한 데이터 패턴(숫자, 문자, 영문자 등)이 정의된 항목(예 : 주민등록번호, 사업자등록번호, 카드번호, 계좌번호, 우편번호, 한글성명 등)이 분석 대상. -날짜 유형 분석은 칼럼 속성이 날짜 유형을 제외한 날짜 데이터 항목(예: varchar(8) 최종시설퇴소일자)이 분석 대상. -코드 분석은 마스터 코드, 개별 코드(업무적으로 자체 정의) 테이블을 참조하는 칼럼들이 분석 대상. 참조무결성 분석은 데이터 논리, 물리적 관계를 서로 참조하도록 설계(Foreign Key)되었으나 DBMS 생성 시 관계를 생성하지 않은 항목이 분석 대상 |
프로파일링 수행 | -등록된 프로파일링 대상에 대해 각각의 분석 기준별로 데이터 프로파일링을 수행 |
프로파일링 결과 분석 | -프로파일링 결과에 대해 분석 관점별로 데이터의 분포와 오류 여부를 분석 -칼럼 분석은 정의되지 않은 Indicator 데이터 확인, Range를 벗어나는 데이터 확인, Garbage 데이터 확인, 테스트 데이터 확인 등이 중점 분석 관점 -비정형패턴 분석은 정의된 Format을 벗어난 유효하지 않은 Format 데이터 확인, 날짜유형 분석, 정의되지 않은 날짜 유형(YYYYMMDD -p YYYYMM) 데이터 확인 등이 중점 분석 관점 -코드 분석은 통합 코드에 등록되지 않은 코드 데이터 확인이 중점 분석 관점 -참조무결성 분석은 RI 관계가 유효하지 않은 데이터 확인이 중점 분석 관점 |
프로파일링 결과 배포 | 프로파일링 분석된 결과를 보고서 형태로 작성하여, 데이터 오너십이 있는 업무부서 및 데이터 관리 책임자에게 전달한다. 전달된 분석 결과는 회의를 통해 공유하고 향후 추진 계획을 논의 |
오류(추정)데이터 식별 | 프로파일링 분석 결과를 토대로 오류 또는 오류로 추정되는 데이터를 식별 |
나. 업무규칙 관리 프로세스
-기업에서 데이터 품질 검증을 위해 관리하는 규칙. 이것은 데이터 값이 정확성을 높이기 위해 수행하는 프로세스로 크게 업뮈子칙 도출 프로세스와 업위子칙 변경 프로세스
1) 업무규칙 도출 프로세스
업무규칙 도출 기준 제시 | 업무규칙 도출 기준 제시는 비즈니스 요구 사항에 따라 지속적으로 관리되어야 하는 데이터 값에 대해 업위규칙을 도출하고 작성하기 위한 가이드 및 규칙을 마련 |
업무규칙 작성 | 업무규칙 작성은 비즈니스 요구 사항의 변화, 실행 변환 기준, 이행 기준 등에 따라 업무에 대한 데이터 값 진단을 위해 서술식 형태로 업위규칙을 정의하고 해당 업무규칙을 SQL 스크립트로 작성 |
업무규칙 검토 | 요청된 업무규칙에 대한 검토 실시 후 보완 및 부적합한 경우 재작성을 요청하고, 보완이 필요한 부분은 업무부서와 데이터 품질 담당자에게 검토 의견을 제시 |
업무 규칙 등록 | 승인이 완료된 업무규칙에 대해 보유중인 품질 관리 시스템 또는 스크립트 방식으로 실행될 수 있도록 등록 |
업무 규칙 등록 통보 | 등록이 완료된 업무규칙에 대해서 등록 결과를 통보 |
2) 업무 규칙 변경 프로세스
업무 규칙 변경 요청 | 업무 프로세스 변경 및 데이터 구조 변경 등에 따라 업위 칙 변경을 요청 |
업무규칙 변경 검토 | 요청된 업무 규칙에 대해서 변경 내용과 규칙 등을 확인 및 검토 |
업무규칙 변경(등록) | 승인된 업무규칙에 대해 업무규칙 요청 내용을 보유 중인 품질 관리 시스템 또는 스크립트를 반영 |
업무규칙 변경 통보 | 업위규칙 변경 통보는 등록이 완료된 업위규칙에 대해서 등록 결과를 통보 |
다. 데이터 값 품질 개선 프로세스
1) 데이터 값 품질 개선 프로세스
데이터 값 개선 대상 정의 | 프로파일링 및 업위규칙 진단 결과를 토대로 분석한 결과, 오류로 판정된 데이터에 대해서 개선 대상을 선정 |
개선 추진 계획 마련 | 오류데이터에 대해 개선을 위해 구체적인 계획을 수립 |
개선 추진 계획 승인 | 수립된 계획에 대해서 데이터 관리 책임자가 검토를 통해 승인 |
오류 원인 분석 | 오류데이터가 유입된 근본적인 원인을 파악 |
향후 개선 과제 | 오류데이터 개선(정제)에 따른 데이터 수치 변화, 통계 불일치 등의 업무에 영향이 큰 경우는 향후 개선 과제로 분류 |
오류데이터 개선 수행 | 당장 업무에 영향도가 적고, 우선적으로 개선(정제)이 필요한 데이터 값에 대해서 업무부서와 데이터 품질 담당자가 수행 |
개선 결과 통보 | 전체 오류데이터 중에서 개선(정제)된 오류데이터, 향후 추진 가능한 오류데이터, 개선이 불가능한 오류데이터로 분류하여 개선 결과를 통보 |
'IT 자격증 > DAP,DAsP' 카테고리의 다른 글
DAP 5과목 데이터베이스 설계와 이용 (0) | 2024.05.14 |
---|---|
DAP 4과목 데이터 모델링 (0) | 2024.05.14 |
DAP 3과목 데이터 표준화 (0) | 2024.05.13 |
DAP 2과목 데이터 요건 분석 (0) | 2024.05.13 |
DAP 1과목 전사아키텍처 이해 (0) | 2024.05.13 |