1. 데이터 분석 기획의 이해
1.1. 분석 기획과 분석 방법론
1.1.1. 분석 기획
| 분석 기획 | 실제 분석을 수행하기 전, 계획을 수립하는 사전 작업 |
| 분석 주제 | ||
| 분석 대상 O (하향식 접근) | 분석 대상 X (상향식 접근) | |
| 분석 방법 O | 최적화 OPTIMIZATION |
통찰 INSIGHT |
| 분석 방법 X | 솔루션 SOLUTION |
발견 DISCOVERY |
| 목표 시점 별 기획 방안 | ||
| 과제 중심 | 장기 마스터플랜 중심 | |
| 목적 | 빠르게 해결 | 지속적 해결 |
| 1차 목표 | Speed & Test | Accuarancy & Deploy |
| 과제 유형 | Quick & Win | Long Term View |
| 접근 방식 | Problem Solving | Problem Definition |
| 분석 기획 시 고려사항 *장가유 | |
| 장애요소 | 발생 가능한 장애요소에 대한 사전 계획 수립 |
| 가용 데이터 | 데이터가 확보될 수 있는지 고려 |
| 유스케이스 | 유사 시나리오 및 솔루션을 최대한 활용 |
1.1.2. 분석 방법론
| 분석 방법론 | 과제 해결을 위한 작업 수행 절차의 정의 |
| 방법론 구성 요소 *상방도산 | 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 |
| 분석 방법론 생성 과정 |
| 암묵지 → (형식화) → 형식지 → (체계화) → 방법론 → (내재화) → 암묵지 |
| 분석 방법론 모델 | |
| 폭포수 모델 | 순차적 진행 현재 단계가 완료되어야 다음 단계로 진행 |
| 프로토타입 모델 | 일부분 개발 후 사용자 요구에 따라 개선 작업을 시행해 점진적으로 개발 고객의 요구를 완전히 이해하지 못할 경우 적용 |
| 나선형 모델 | 반복을 통해 점증적으로 개발 위험요소 사전 제거에 초점 |
| 계층적 프로세스 모델 | 스텝(WBS 워크패키지, 입력/처리/출력) - 태스크 - 단계로 구성 |
| 반복적 모델 | 증분형: 전체 시스템을 작은 기능 단위로 나누어 개발 진화형: 핵심 부분 개발 후 요구사항을 반영해 개발 |
| 애자일 | 짧은 개발 주기를 가지고, 고객 피드백을 지속적으로 반영하여 반복적인 개발 |
1.1.3. 전통적인 분석 방법론
| KDD 분석 방법론 *Sel P Trans M E | |
| 데이터셋 선택 Selection | 프로젝트 목표 설정. 필요 데이터 선택. 타깃 데이터 생성 |
| 데이터 전처리 Preprocessing | 데이터 제거 및 재가공 |
| 데이터 변환 Transformation | 변수 생성/선택 및 차원 축소, 학습용/검증용 데이터 분리 |
| 데이터 마이닝 Data Mining | 데이터 마이닝 기법 선택. 알고리즘 적용 |
| 해석과 평가 Evaluation | 분석 목적과의 일치성 확인. 업무 활용 방안 마련 |
| DRISP-DM 분석 방법론 *업데데 모델평가전 | |
| 업무 이해 | 업무 목적 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립 |
| 데이터 이해 | 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인 |
| 데이터 준비 | 데이터 정제/통합/포매팅, 분석용 데이터셋 선택/편성 |
| 모델링 | 모델링 기법 선택 → 모델 테스트 계획 설계 → 모델 작성 → 모델 평가 |
| 평가 | 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가 |
| 전개 | 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰 |
| 피드백: 업무 이해 ↔ 데이터 이해 위대한 실패: 평가 → (문제 발생)→ 업무 이해 |
|
| SEMMA 분석 방법론 | ||||
| Sample | Explore | Modify | Model | Assess |
| data 추출 | 탐색, 오류 확인 | 데이터 변환 | 알고리즘 적용 | 모델링 평가, 검증 |
1.1.4. 빅데이터 분석 방법론 *PPADD
| 단계 | 태스크 | 스텝 |
| 분석 기획 Planning |
비즈니스 이해 및 범위 설정 | |
| 프로젝트 정의 및 계획 수립 | SOW(프로젝트 범위 정의서), WBS(업무분할구조) | |
| 프로젝트 위험 계획 수립 | 위험 대응 계획(회피, 전이, 완화, 수용) *회전완수 | |
| 데이터 준비 Preparing |
필요 데이터 정의 | 피드백 가능 |
| 데이터 스토어 설계 | ||
| 데이터 수집 및 정합성 검정 | ||
| 데이터 분석 Analyzing |
분석용 데이터 준비 | |
| 텍스트 분석 | ||
| 탐색적 분석 | ||
| 모델링 | ||
| 모델 평가 및 검증 | ||
| 시스템 구현 Developing |
설계 및 구현 | |
| 시스템 테스트 및 운영 | ||
| 평가 및 전개 Deploying |
모델 발전 계획 수립 | |
| 프로젝트 평가 및 보고 |
1.2. 분석 과제 발굴
| 분석 과제 탐색 방법 | |
| 하향식 접근법 | 분석 대상을 알고 있을 때, 각 과정을 체계적으로 단계화하여 문제를 해결 |
| 상향식 접근법 | 분석 대상을 알지 못할 때, 다양한 데이터의 조합 속에서 인사이트 발굴 *주로 비지도 학습 기법 |
| 하향식 접근법 |
||
| 문제 탐색 | 비즈니스 모델 탐색 기법 | 비즈니스 모델 갠버스 9가지 블록을 5가지로 단순화 5가지: 업무, 제품, 고객, 규제와 감사, 지원 인프라 |
| 외부 참조 모델 기반 문제 탐색 기법 | 유사 동종 사례 벤치마킹 = 가장 빠르고 쉬운 방식 분석 유스케이스: 분석 적용 시의 업무 흐름을 개념적으로 설명한 것 |
|
| 분석 기회 발굴 범위 확장 | 거시적(STEEP)•경쟁자 확대•시장의 니즈•역량의 재해석 관점 | |
| 문제 정의 | 식별된 비즈니스 문제 → 데이터의 문제 변환 | |
| 해결 방안 탐색 | 기존 시스템으로 가능한가? 분석 역량이 있는가? → 기존 시스템 활용 / 역량 확보(교육&채용) / 시스템 고도화 / 아웃소싱 |
|
| 타당성 검토 | 경제적 타당성 | 비용 대비 편익 분석 |
| 데이터 및 기술적 타당성 | 데이터 존재 여부, 분석 시스템 환경, 분석 역량 고려 | |
| 디자인 씽킹 | |
| IDEO사 | [혼합 접근법] 발산(상향식) - 수렴(하향식)을 반복 더블 다이아몬드 프로세스(문제 발견 / 솔루션 제시) |
| 스탠퍼드대학 d.school | [상향식 접근법] 공감 → 문제 정의 → 아이디어 도출 → 프로토타입 → 테스트 → 평가 |
| 프로토타이핑 접근법 | |
| 개념 | [상향식 접근법] 먼저 분석을 시도하고, 그 결과를 확인하며 개선하는 방법 문제 인식 수준, 데이터 존재 여부, 사용 목적이 불명확할 경우 유용 |
| 프로세스 | 가설 생성 → 디자인 실험 → 실제 환경 테스트 → 인사이트 도출 및 가설 확인 |
| 지도 학습과 비지도 학습 | ||
| 지도 학습 | 정답이 있는 데이터 | 머신러닝, 의사결정나무, 인공신경망, 분류분석 등 |
| 비지도 학습 | 정답이 없는 데이터 | 장바구니 분석, 군집분석, 기술통계, 프로파일링 등 |
1.3. 분석 프로젝트 관리 방안
| 분석 과제 관리 시 고려해야 할 속성 | |
| 데이터 양 | |
| 데이터 복잡도 | 정형, 비정형, 반정형 |
| 분석 속도 | 실시간 수행이 필요한 경우 고려 |
| 분석 복잡도 | 복잡할수록 정확도는 증가하지만 해석력은 낮아짐 |
| 정확도/정밀도 | 정확도: 모델과 실제 값 차이 → 활용성 정밀도: 모델 값들의 편차 수준 → 안정성 |
| 분석 과제 관리 방안(프로젝트 관리 지침) *이범통 의자 시원 조리품 |
| 이해관계자 - 범위 - 통합 - 의사소통 - 자원 - 시간(Time Boxing: 완수 못해도 다음 작업) - 원가 - 조달(아웃소싱) - 리스크 - 품질 |
| 능력 성숙도 통합 모델 | |
| 1단계 | 개인의 역량이 성공/실패의 주요 요인 |
| 2단계 | 일정이나 비용이 성공/실패의 주요 요인 |
| 3단계 | 조직을 관리하기 위한 프로세스가 존재 |
| 4단계 | 체계적 관리하에 프로젝트 및 산출물에 대한 정량적인 측정이 가능 |
| 5단계 | 최적화된 프로세스 보유, 지속적인 개선을 목표 |
2. 분석 마스터 플랜
2.1. 마스터플랜 수립
| 분석 마스터플랜 |
| 분석 프로젝트를 위한 전체 설계도 |
| 마스터플랜 수립 프레임워크 |
|
| 1. 우선순위 설정 | 전략적 중요도, 실행 용이성, 비즈니스 성과 및 ROI를 고려하여 우선순위 설정 |
| 2. 과제 적용 범위 및 방식 설정 | 업무 내재화 • 분석 데이터 • 기술의 적용 수준 설정 |
| 3. 분석 구현 로드맵 수립 | Analytics 구현 로드맵 수립 |
| 일반적인 우선순위 평가 |
||
| 전략적 중요도 | 전략적 필요성 | 본원적 업무에 직접적으로 밀접한 관계가 있는가? |
| 시급성 | 고객 요구사항, 업무능률, 경쟁우위 측면에서 시급히 수행되어야 하는가? | |
| 실행 용이성 | 투자 용이성 | 기간 및 인력 투입 용이성, 비용 및 투자예산 확보 가능성 |
| 기술 용이성 | 기술의 안정성, 유지보수 용이성, 신기술 적용성 등 | |
| ROI 활용 우선순위 평가 | |||
| 시급성 | 전략적 중요도, 목표가치(KPI) | Value | 비즈니스 효과 |
| 난이도 | 데이터 획득/저장/가공 비용, 분석 적용 비용, 분석 수준 | Volume, Variety, Velocity | 투자 비용 요소 |
| 포트폴리오 사분면 | ||
| 어려움 현재 |
어려움 미래 |
|
| 쉬움 현재 |
쉬움 미래 |
|
| 시급성 중시 | 쉬움/현재 → 쉬움/미래 → 어려움/미래 | |
| 난이도 중시 | 쉬움/현재 → 어려움/현재 → 어려움/미래 | |
2.2. 분석 거버넌스 체계 수립
2.2.1. 분석 거버넌스
| 분석 거버넌스 |
| 데이터 분석을 기업 문화로 정착하고 고도화하기 위한 체계적인 데이터 관리 체계 |
| 분석 거버넌스 구성 요소 *데시프조마 |
| 데이터, 시스템, 프로세스, 조직, 마인드 및 교육 |
| 분석 성숙도 수준 진단 (CMMI) | ||
| 분석 준비도 *IT데기업조직문화 |
IT인프라, 데이터, 분석 기법, 분석 업무 파악, 인력 및 조직, 문화 | |
| 분석 성숙도 | 부문 | 비즈니스, 조직 및 역량, IT |
| 단계 | 도입(시작) - 활용(업무 적용) - 확산(전사 차원) - 최적화(혁신, 성과) | |
| 사분면 *준정확도 | 준비형 | 준비도 낮음, 성숙도 낮음 - 준비 필요 |
| 정착형 | 준비도 낮음, 성숙도 높음 - 정착 필요 | |
| 확산형 | 준비도 높음, 성숙도 높음 - 지속적 확산 가능 | |
| 도입형 | 준비도 높음, 성숙도 낮음 - 준비됐으니 도입 필요 | |
| 분석 지원 인프라 방안: 플랫폼(중앙집중) | ||
| 광의의 분석 플랫폼 | 협의의 분석 플랫폼 | 데이터 처리 프레임워크, 분석 엔진, 분석 라이브러리 |
| 컴퓨터 시스템 | 하드웨어, 운영체제 | |
| - | 분석 서비스 제공 엔진, 분석 애플리케이션, 분석 서비스 제공 API | |
2.2.2. 데이터 거버넌스
| 데이터 거버넌스 |
| 전사의 모든 데이터에 대한 정책과 프로세스 관점에서의 관리 체계 |
| 데이터 거버넌스 구성 요소 *원조프 |
| 원칙(지침과 가이드), 조직(역할과 책임), 프로세스(활동과 체계) |
| 데이터 거버넌스 체계 | |
| 데이터 표준화 | 데이터 사전 구축, 데이터 표준 용어 설정, 명명 규칙 수립 등 |
| 데이터 관리 체계 | 효율성을 위한 관리 원칙, 항목별 상세 프로세스, 데이터 생명 주기 관리 방안 수립 |
| 데이터 저장소 관리 | 전사 차원의 저장소 구성, 데이터 구조 변경에 따른 사전 영향 평가 |
| 표준화 활동 | 모니터링, 교육, 표준화 개선 활동 |
| 빅데이터 거버넌스 |
| 데이터 거버넌스 체계 + 빅데이터 효율적 관리, 데이터 최적화, 정보보호, 데이터 가테고리별 관리 책임자 지정 등 |
2.2.3. 데이터 조직 및 인력 방안
| 데이터 분석 조직(DSCoE) |
| 경쟁력 확보를 위해 빅데이터 속에서 인사이트를 찾아 액션화하는 조직 |
| 데이터 분석 조직 유형 | |
| 집중형 | 독립적인 전담 조직. 우선순위 설정 가능. 업무 중복 및 이원화 문제. |
| 기능형 | 해당 업무 부서에서 직접 분석. 특정 부서에 국한된 분석. 업무 중복 및 이원화 문제. |
| 분산형 | 분석 조직 인력을 각 부서에 배치. 우선수위 설정 가능. 신속한 실무 적용 가능. |
'자격증 > ADSP' 카테고리의 다른 글
| [ADSP] 3과목_통계 분석 (1) | 2025.11.02 |
|---|---|
| [ADSP] 3과목_R기초와 데이터 마트 (0) | 2025.10.27 |
| [ADSP] 1과목 (0) | 2025.10.25 |