31강. 데이터 전환(ETL; Extraction, Transformation, Load, 즉 추출, 변환, 적재 과정)
- 기존 정보 시스템에 축적되어 있는 데이터를 추출(Extraction)하여 새로 개발할 정보 시스템에서 운영할 수 있도록 변환(Transformation)한 후, 적재(Loading)하는 일련의 과정
- 데이터 이행(Data Migration) 또는 데이터 이관이라고도 함
- 데이터 전환 계획서 : 데이터 전환이 필요한 대상을 분석하여 데이터 전환 작업에 필요한 모든 계획을 기록하는 문서
- 주요 항목 : 데이터 전환 개요, 대상 및 범위, 환경 구성, 조직 및 역할, 일정, 전환 방안, 정비 방안, 비상 계획, 데이터 복구 대책
32강. 데이터 검증
- 원천 시스템의 데이터를 목적 시스템의 데이터로 전환하는 과정이 정상적으로 수행되었는지 여부를 확인하는 과정
1. 검증 방법에 따른 분류
- 로그 검증 : 데이터 전환 과정에서 작성하는 추출, 전환, 적재 로그를 검증
- 기본 항목 검증 : 로그 검증 외에 별도로 요청된 검증 항목에 대해 검증
- 응용 프로그램 검증 : 응용 프로그램을 통한 데이터 전환의 정합성을 검증
- 응용 데이터 검증 : 사전에 정의된 업무 규칙을 기준으로 데이터 전환의 정합성을 검증
- 값 검증 : 숫자 항목의 합계 검증, 코드 데이터의 범위 검증, 속성 변경에 따른 값 검증을 수행
2. 검증 단계에 따른 분류
- 추출(Extraction) : 원천 시스템 데이터에 대한 정합성 확인 / 로그 검증
- 전환(Transformation) : 매핑 정의서에 정의된 내용의 정확한 반영과 매핑 정의서 오류 여부 확인 / 로그 검증
- DB 적재(Load) : SAM 파일을 적재하는 과정에서 발생할 수 있는 오류나 데이터 누락 여부 확인 / 로그 검증
- DB 적재 후 : 적재 완료 후 정합성 확인 / 기본 항목 검증
- 전환 완료 후 : 데이터 전환 완료 후 추가 검증 과정을 통해 데이터 전환의 정합성 검증 / 응용 프로그램 검증, 응용 데이터 검증
33강. 오류데이터 측정 및 정제
- 고품질의 데이터를 운영 및 관리하기 위해 수행
- 순서 : 데이터 품질 분석 -> 오류 데이터 측정 -> 오류 데이터 정제
1) 데이터 품질 분석 : 원천 및 목적 시스템 데이터의 정합성 여부 확인
2) 오류 데이터 측정 : 데이터 품질 분석을 기반으로 정상 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록 작성
3) 오류 데이터 정제 : 오류 관리 목록의 각 항목을 분석하여 원천 데이터를 정제하거나 전환 프로그램을 수정
1. 오류 상태
- Open : 오류가 보고만 되고 분석되지 않은 상태
- Assigned : 오류의 영향 분석 및 수정을 위해 개발자에게 오류를 전달한 상태
- Fixed : 개발자가 오류를 수정한 상태
- Closed : 수정된 오류에 대해 테스트를 다시 했을 때 오류가 발견되지 않은 상태
- Deferred : 오류 수정을 연기한 상태
- Classified : 보고된 오류를 관련자들이 확인했을 때 오류가 아니라고 확인된 상태
2. 데이터 정제요청서
- 원천 데이터의 정제와 전환 프로그램의 수정을 위해 요청사항 및 조치사항 등 데이터 정제와 관련된 전반적인 내용을 문서로 작성한 것
3. 데이터 정제보고서
- 데이터 정제요청서를 통해 정제된 원천 데이터가 정상적으로 정제되었는지 확인한 결과를 문서로 작성한 것
'IT > 정보처리기사' 카테고리의 다른 글
[시나공 토막강의] 36-39강 정리 (0) | 2023.02.21 |
---|---|
[시나공 토막강의] 34-35강 정리 (0) | 2023.02.20 |
[시나공 토막강의] 26-30강 정리 (0) | 2023.02.12 |
[시나공 토막강의] 22-25강 정리 (0) | 2023.02.09 |
[시나공 토막강의] 20-21강 정리 (0) | 2023.02.07 |