출제 포인트
- 기업에서 분석프로젝트를 수행하기 위해 의사결정자를 섣득할 때 꼭 필요한 과정을 학습
- 데이터를 분석하기 위해 필요한 방법론과 프로세스를 꼭 알아해 한다
- 실제 비즈니스에서 분석하고자 하는 분석과제를 정의하는 방법과 마스터 플랜을 확정하는 방법을 이해
학습목표
- 분석 기획 방향성 도출을위한 분석 기획의 측징과 고려사항을 이해
- 분석 방법론 중에서 KDD분석 방법론에 대해 이해
- 분석 방법론 중에서 CRISP-DM분석 방법론에 대해 이해
- 빅데이터 분석 방법론을 이해하고 각 단계별 내용을 설명할 수 있다
데이터 분석 방법론과 프로세스의 필요성
- 대용량 데이터베이스와 빅데이터를 통해 새로운 인사이트를 도출하고자 하는 시도가 증가하여 데이터를 분석할 때,
어떤 방법론과 어떤 프로세스로 데이터를 분석하는 것이 효율적인지 관심 증가
- 빅데이터나 대용량 데이터의 경우, 분석하고자 하는 목적에 따라 가장 적절한 방법론을 찾는 것이 중요
- 대용량 데이터를 분석하는 프로세스에서 중요한 과정을 생략하거나 중복할 경우 발생되는 비용은 엄청난 손실로 나타날 수 있으므로 효율적인 프로세스를 통해 분석 업무를 수행하는 것이 중요
KDD, CRISP-DM 빅데이터 분석 방법론
- 정형화된 데이터베이스를 분석하는 정형 데이터 마이닝 프로세스로 가장 많이 활용되고 있는 프로세스는 KDD(Knowledge Discovery in Database) 분석 방법론과 CRISP-DM 프로세스
<분석기획 방향성 도출>
1. 분석기획의 특징
1) 분석기획이란?
- 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
- 분석과제 및 프로젝트를 직접 수행하는 것은 아니지만, 어떠한 목표(What)를 달성하기 위하여(Why) 어떠한 데이터를 가지고 어떤 방식(How)으로 수행할 지에 대한 일련의 계획을 수립하는 작업
-> 성공적인 분석결과를 도출하기 위한 중요한 사전작업
2) 데이터 사이언티스트의 역량
- 수학/통계학적 지식 및 정보기술(IT기술, 해킹기술, 통신기술 등) 뿐만 아니라 해당 비즈니스에 대한 이해와 전문성을 포함한 3가지 영역에 대한 고른 역량과 시각이 요구
- Math&Statistics / Information&Technology / Domain Knowledge
- 분석을 기획한다는 것은 해당 문제 영역에 대한 전문성 역량 및 수학/통계학적 지식을 활용한 분석 역량과 분석의 도구인 데이터 및 프로그래밍 기술 역량에 대한 균형 잡힌 시각을 가지고 방향성 및 계획을 수립해야 함
2. 분석 대상과 방법
- 분석은 대상(What)과 분석의 방법(How)에 따라 4가지로 나뉨
- 특정한 분석 주제를 대상으로 진행할 경우, 분석 주제 및 기법의 특성상 4가지 유형을 넘나들면서 분석을 수행하고 결과 도출 과정 반복
- Optimization / Solution / Insight / Discovery
3. 목표 시점 별 분석 기획 방안
- 당면한 과제를 빠르게 해결하는 과제 중심적인 접근 방식
- 지속적인 분석 내재화를 위한 장기적인 마스터 플랜 방식
- 분석기획에서는 문재해결을 위한 단기적인 접근방식과 분석과제 정의를 위한 중장기적인 마스터 플랜 접근방식을 융합하여 적용하는 것이 중요
- 의미있는 분석을 위해서는 분석 기술, IT 및 프로그래밍, 분석 주제에 대한 도메인 전문성, 의사소통이 중요
- 분석대상 및 방식에 따른 다양한 분석 주제를 과제 단위 혹은 마스터 플랜 단위로 도출할 수 있어야 함
4. 분석 기획시 고려사항
가) 분석의 기본인 가용 데이터(Available Data)에 대한 고려
- 분석을 위한 데이터의 확보가 우선
- 데이터의 유형에 따라 적용 가능한 솔루션 및 분석방법이 다르기 때문에 유형에 대한 분석이 선행
나) 분석을 통해 가치가 창출될 수 있는 적절한 활용방안과 유즈케이스(Proper Business Use Case) 탐색 필요
- "바퀴를 재발명하지 마라"는 격언처럼 기존에 잘 구현되어 활용되고 있는 유사 분석 시나리오 및 솔루션을 최대한 활용하는 것이 중요
다) 분석 수행시 발생하는 장애요소들에 대한 사전계획 수립(Low Barrier Of Execution)
- 일회성 분석으로 그치지 않고, 조직의 역량으로 내재화하기 위해서는 충분하고 계속적인 교육 및 활용방안 등의 변화 관리(Change Management)가 고려
(참고)
정형 데이터
• 데이터 자체로 분석 가능
• 데이터베이스로 관리
• RDB구조의 데이터
• ERP, CRM, SCM 등 정보시스템
• DB로 정제된 데이터
반정형 데이터
• 데이터로 분석이 가능하 지만 해석이 불가능하며 메타정보를 활용해야 해 석이 가능
• 로그데이터, 모바일데이터, 센싱데이터
• 센서중심으로 스트리밍되는 머신데이터
비정형 데이터
• 데이터 자체로 분석이 불가능
•특정한 처리 프로세스를 거쳐 분석데이터로 변경 후 분석
• 영상, 음성, 문자 등
• email.,보고서,소셜미디어 데이터
'ADsP(데이터 분석 준전문가) > 개념정리' 카테고리의 다른 글
[2-1. 데이터 분석 기획의 이해] 3. 분석과제 발굴 방법론 (0) | 2024.01.01 |
---|---|
[2-1. 데이터 분석 기획의 이해] 2. 분석 방법론 (0) | 2024.01.01 |
[1-4. 최신 빅데이터 상식] (1) | 2024.01.01 |
[1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트] (1) | 2024.01.01 |
[1-2. 데이터의 가치와 미래] (1) | 2024.01.01 |