1. 데이터 분석 기획의 이해

1.1. 분석 기획과 분석 방법론

1.1.1. 분석 기획

분석 기획 실제 분석을 수행하기 전, 계획을 수립하는 사전 작업

 

분석 주제
  분석 대상 O (하향식 접근) 분석 대상 X (상향식 접근)
분석 방법 O 최적화
OPTIMIZATION
통찰
INSIGHT
분석 방법 X 솔루션
SOLUTION
발견
DISCOVERY

 

목표 시점 별 기획 방안
  과제 중심 장기 마스터플랜 중심
목적 빠르게 해결 지속적 해결
1차 목표 Speed & Test Accuarancy & Deploy
과제 유형 Quick & Win Long Term View
접근 방식 Problem Solving Problem Definition

 

분석 기획 시 고려사항 *장가유
애요소 발생 가능한 장애요소에 대한 사전 계획 수립
용 데이터 데이터가 확보될 수 있는지 고려
스케이스 유사 시나리오 및 솔루션을 최대한 활용

 

1.1.2. 분석 방법론

분석 방법론 과제 해결을 위한 작업 수행 절차의 정의

 

방법론 구성 요소 *상방도산 세한 절차, 법, 구와 기법, 템플릿과 출물
분석 방법론 생성 과정
암묵지 → (형식화) → 형식지 → (체계화) → 방법론 → (내재화) → 암묵지
분석 방법론 모델
폭포수 모델 순차적 진행
현재 단계가 완료되어야 다음 단계로 진행
프로토타입  모델 일부분 개발 후 사용자 요구에 따라 개선 작업을 시행해 점진적으로 개발
고객의 요구를 완전히 이해하지 못할 경우 적용
나선형 모델 반복을 통해 점증적으로 개발
위험요소 사전 제거에 초점
계층적 프로세스 모델 스텝(WBS 워크패키지, 입력/처리/출력) - 태스크 - 단계로 구성
반복적 모델 증분형: 전체 시스템을 작은 기능 단위로 나누어 개발
진화형: 핵심 부분 개발 후 요구사항을 반영해 개발
애자일 짧은 개발 주기를 가지고, 고객 피드백을 지속적으로 반영하여 반복적인 개발

 

1.1.3. 전통적인 분석 방법론

KDD 분석 방법론 *Sel P Trans M E
데이터셋 선택 Selection 프로젝트 목표 설정. 필요 데이터 선택. 타깃 데이터 생성
데이터 전처리 Preprocessing 데이터 제거 및 재가공
데이터 변환 Transformation 변수 생성/선택 및 차원 축소, 학습용/검증용 데이터 분리
데이터 마이닝 Data Mining 데이터 마이닝 기법 선택. 알고리즘 적용
해석과 평가 Evaluation 분석 목적과의 일치성 확인. 업무 활용 방안 마련

 

DRISP-DM 분석 방법론 *업데데 모델평가전
무 이해 업무 목적 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
이터 이해 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
이터 준비 데이터 정제/통합/포매팅, 분석용 데이터셋 선택/편성
모델 모델링 기법 선택 → 모델 테스트 계획 설계 모델 작성  모델 평가
평가 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가
전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
피드백: 업무 이해 ↔ 데이터 이해
위대한 실패: 평가 → (문제 발생)→ 업무 이해

 

SEMMA 분석 방법론
Sample Explore Modify Model Assess
data 추출 탐색, 오류 확인 데이터 변환 알고리즘 적용 모델링 평가, 검증

 

1.1.4. 빅데이터 분석 방법론 *PPADD

단계 태스크 스텝
분석 기획
Planning
비즈니스 이해 및 범위 설정  
프로젝트 정의 및 계획 수립 SOW(프로젝트 범위 정의서), WBS(업무분할구조)
프로젝트 위험 계획 수립 위험 대응 계획(회피, 전이, 완화, 수용) *회전완수
데이터 준비
Preparing
필요 데이터 정의 피드백 가능
데이터 스토어 설계
데이터 수집 및 정합성 검정
데이터 분석
Analyzing
분석용 데이터 준비
텍스트 분석
탐색적 분석
모델링
모델 평가 및 검증
시스템 구현
Developing
설계 및 구현  
시스템 테스트 및 운영  
평가 및 전개
Deploying
모델 발전 계획 수립  
프로젝트 평가 및 보고  

 


1.2. 분석 과제 발굴

분석 과제 탐색 방법
하향식 접근법 분석 대상을 알고 있을 때, 각 과정을 체계적으로 단계화하여 문제를 해결
상향식 접근법 분석 대상을 알지 못할 때, 다양한 데이터의 조합 속에서 인사이트 발굴 *주로 비지도 학습 기법

 

하향식 접근법
문제 탐색 비즈니스 모델 탐색 기법 비즈니스 모델 갠버스 9가지 블록을 5가지로 단순화
5가지: 업무, 제품, 고객, 규제와 감사, 지원 인프라
외부 참조 모델 기반 문제 탐색 기법 유사 동종 사례 벤치마킹 = 가장 빠르고 쉬운 방식
분석 유스케이스: 분석 적용 시의 업무 흐름을 개념적으로 설명한 것
분석 기회 발굴 범위 확장 거시적(STEEP)•경쟁자 확대•시장의 니즈•역량의 재해석 관점
문제 정의 식별된 비즈니스 문제  데이터의 문제 변환
해결 방안 탐색 기존 시스템으로 가능한가? 분석 역량이 있는가?
기존 시스템 활용 / 역량 확보(교육&채용) / 시스템 고도화 / 아웃소싱
타당성 검토 경제적 타당성 비용 대비 편익 분석
데이터 및 기술적 타당성 데이터 존재 여부, 분석 시스템 환경, 분석 역량 고려

 

디자인 씽킹
IDEO사 [혼합 접근법] 발산(상향식) - 수렴(하향식)을 반복
더블 다이아몬드 프로세스(문제 발견 / 솔루션 제시)
스탠퍼드대학 d.school [상향식 접근법]
공감  문제 정의  아이디어 도출  프로토타입  테스트  평가

 

프로토타이핑 접근법
개념 [상향식 접근법]
먼저 분석을 시도하고, 그 결과를 확인하며 개선하는 방법
문제 인식 수준, 데이터 존재 여부, 사용 목적이 불명확할 경우 유용
프로세스 가설 생성 디자인 실험 실제 환경 테스트  인사이트 도출 및 가설 확인

 

지도 학습과 비지도 학습
지도 학습 정답이 있는 데이터 머신러닝, 의사결정나무, 인공신경망, 분류분석 등
비지도 학습 정답이 없는 데이터 장바구니 분석, 군집분석, 기술통계, 프로파일링 등

 


1.3. 분석 프로젝트 관리 방안

분석 과제 관리 시 고려해야 할 속성
데이터 양  
데이터 복잡도 정형, 비정형, 반정형
분석 속도 실시간 수행이 필요한 경우 고려
분석 복잡도 복잡할수록 정확도는 증가하지만 해석력은 낮아짐
정확도/정밀도 정확도: 모델과 실제 값 차이  활용성
정밀도: 모델 값들의 편차 수준 안정성

 

분석 과제 관리 방안(프로젝트 관리 지침) *이범통 의자 시원 조리품
해관계자 - 위 - 합 - 사소통 - 원 - 간(Time Boxing: 완수 못해도 다음 작업) - 가 - 달(아웃소싱) - 스크 -

 

능력 성숙도 통합 모델
1단계 개인의 역량이 성공/실패의 주요 요인
2단계 일정이나 비용이 성공/실패의 주요 요인
3단계 조직을 관리하기 위한 프로세스가 존재
4단계 체계적 관리하에 프로젝트 및 산출물에 대한 정량적인 측정이 가능
5단계 최적화된 프로세스 보유, 지속적인 개선을 목표

 


2. 분석 마스터 플랜

2.1. 마스터플랜 수립

분석 마스터플랜
분석 프로젝트를 위한 전체 설계도

 

마스터플랜 수립 프레임워크
1. 우선순위 설정 전략적 중요도, 실행 용이성, 비즈니스 성과 및 ROI를 고려하여 우선순위 설정
2. 과제 적용 범위 및 방식 설정 업무 내재화 • 분석 데이터 • 기술의 적용 수준 설정
3. 분석 구현 로드맵 수립 Analytics 구현 로드맵 수립

 

일반적인 우선순위 평가
전략적 중요도 전략적 필요성 본원적 업무에 직접적으로 밀접한 관계가 있는가?
시급성 고객 요구사항, 업무능률, 경쟁우위 측면에서 시급히 수행되어야 하는가?
실행 용이성 투자 용이성 기간 및 인력 투입 용이성, 비용 및 투자예산 확보 가능성
기술 용이성 기술의 안정성, 유지보수 용이성, 신기술 적용성 등

 

ROI 활용 우선순위 평가
시급성 전략적 중요도, 목표가치(KPI) Value 비즈니스 효과
난이도 데이터 획득/저장/가공 비용, 분석 적용 비용, 분석 수준 Volume, Variety, Velocity 투자 비용 요소

 

포트폴리오 사분면
어려움
현재
어려움
미래
쉬움
현재
쉬움
미래
시급성 중시 쉬움/현재 → 쉬움/미래 → 어려움/미래
난이도 중시 쉬움/현재 → 어려움/현재 → 어려움/미래

 


2.2. 분석 거버넌스 체계 수립

2.2.1. 분석 거버넌스

분석 거버넌스
데이터 분석을 기업 문화로 정착하고 고도화하기 위한 체계적인 데이터 관리 체계

 

분석 거버넌스 구성 요소 *데시프조마
데이터, 시스템, 프로세스, 조직, 마인드 및 교육

 

분석 성숙도 수준 진단 (CMMI)
분석 준비도
*IT데기업조직문화
IT인프라, 이터, 분석 법, 분석 무 파악, 인력 및 조직, 문화
분석 성숙도 부문 비즈니스, 조직 및 역량, IT
단계 도입(시작) - 활용(업무 적용) - 확산(전사 차원) - 최적화(혁신, 성과)
사분면 *준정확도 준비형 준비도 낮음, 성숙도 낮음 - 준비 필요
정착형 준비도 낮음, 성숙도 높음 - 정착 필요
확산형 준비도 높음, 성숙도 높음 - 지속적 확산 가능
도입형 준비도 높음, 성숙도 낮음 - 준비됐으니 도입 필요

 

분석 지원 인프라 방안: 플랫폼(중앙집중)
광의의 분석 플랫폼 협의의 분석 플랫폼 데이터 처리 프레임워크, 분석 엔진, 분석 라이브러리
컴퓨터 시스템 하드웨어, 운영체제
- 분석 서비스 제공 엔진, 분석 애플리케이션, 분석 서비스 제공 API

 

2.2.2. 데이터 거버넌스

데이터 거버넌스
전사의 모든 데이터에 대한 정책과 프로세스 관점에서의 관리 체계

 

데이터 거버넌스 구성 요소 *원조프
원칙(지침과 가이드), 조직(역할과 책임), 프로세스(활동과 체계)

 

데이터 거버넌스 체계
데이터 표준화 데이터 사전 구축, 데이터 표준 용어 설정, 명명 규칙 수립 등
데이터 관리 체계 효율성을 위한 관리 원칙, 항목별 상세 프로세스, 데이터 생명 주기 관리 방안 수립
데이터 저장소 관리 전사 차원의 저장소 구성, 데이터 구조 변경에 따른 사전 영향 평가
표준화 활동 모니터링, 교육, 표준화 개선 활동

 

빅데이터 거버넌스
데이터 거버넌스 체계 + 빅데이터 효율적 관리, 데이터 최적화, 정보보호, 데이터 가테고리별 관리 책임자 지정 등

 

2.2.3. 데이터 조직 및 인력 방안

데이터 분석 조직(DSCoE)
경쟁력 확보를 위해 빅데이터 속에서 인사이트를 찾아 액션화하는 조직

 

데이터 분석 조직 유형
집중형 독립적인 전담 조직. 우선순위 설정 가능. 업무 중복 및 이원화 문제. 
기능형 해당 업무 부서에서 직접 분석. 특정 부서에 국한된 분석. 업무 중복 및 이원화 문제.
분산형 분석 조직 인력을 각 부서에 배치. 우선수위 설정 가능. 신속한 실무 적용 가능.

 

 

'자격증 > ADSP' 카테고리의 다른 글

[ADSP] 3과목_통계 분석  (1) 2025.11.02
[ADSP] 3과목_R기초와 데이터 마트  (0) 2025.10.27
[ADSP] 1과목  (0) 2025.10.25

+ Recent posts