본문 바로가기

ADsP(데이터 분석 준전문가)/문제풀이

[2. 데이터 분석 기획] 오답노트

728x90

1. 분석의 대상 과 분석의 방식에 따라 4가지로 분류
- 대상을 알고, 방식을 알면 최적화(optimization)
- 대상을 알고, 방식을 모르면 solution
- 대상을 모르고, 방식을 알면 통찰(insight)
- 대상을 모르고, 방식을 모르면 discovery

2. 분석대상이 명확하게 무엇인지 모르는 경우에는 기존 분석 방식을 활용하여 (통찰)을 도출해냄으로써 문제의 도출 및 해결에 기여하거나 (발견) 접근법으로 분석 대상 자체를 새롭게 도출할 수 있다

3. 분석 기획 고려사항 중 장애요소에 대한 설명
- 비용대비 효과의 적정한 비용
- 분석 모형의 안정적 성능 확보
- 조직 역략으로 내재화를 위한 변화 관리

4. 성공적인 분석을 위해서 고려햐야 할 요소
- 관련 데이터의 파악 -> 분석의 기본이 되는 데이터에 대한 고려가 필요하다
- 비즈니스 케이스 확보 -> 분석을 통해서 가치가 창출될 수 있는 적절한 활용방안과 활용 가능한 유즈케이스의 탐색이 필요하다
- 이행 저해 요소 관리 -> 분석을 수행함에 있어서 발생하는 장애요소들에 대한 사전계획수립이 필요

5. 정형 데이터의 유형은 ERP, CRM, SCM등 정보시스템, 반정형 데이터의 유형은 로그데이터, 모바일 데이터, 센싱데이터, 비정형 데이터의 유형은 영상, 음성 문자

6. 분석방법론 모델
- 폭포수 모델 : 단계를 순차적으로 진행하는 방법
- 프로토타입 모델 : 점진적으로 시스템을 개발
- 나선형 모델 : 반복을 통해 점증적으로 개발하는 방법
- 애자일 모델 : 고객의 요구에 민첩하게 대응하고 그때그때 주어지는 문제를 풀어나가는 방법

7. CRISP-DM 방법론의 모델링 단계에서 수행하는 테스크
- 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가

CRISP-DM 프로세스는 6단계로 이루어짐
1) 업무이해 : 업무목적 파악, 상황파악, 데이터마이닝, 목표설정, 프로젝트 계획수립
2) 데이터 이해 : 초기데이터수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질확인
3) 데이터 준비 : 분석용 데이터 셋 선택, 데이터 정제, 분석용 데이터 셋 편성, 데이터 통합, 데이터 포맷팅
4) 모델링 : 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가
5) 평가 : 분석결과 평가, 모델링 과정평가, 모델적용성 평가
6) 전개 : 모니터링과 모델의 유지보수 계획마련

8. 빅데이터 분석 방법론의 분석기획 단계 순서
- 프로젝트 범위설정 > 데이터 분석 프로젝트 정의 > 프로젝트 수행계획 수립 > 데이터 분석 위험 식별

9. 빅데이터 분석 방법론에서 단계 간 피드백이 반복적으로 많이 발생할 수 있는 단계 
- 데이터 준비 단계 -> 데이터 분석 단계

빅데이터 분석 방법론 - 5단계
1) 분석기획 : 비즈니스 도메인과 문제점을 인식하고 분석 계획 및 프로젝트 수행계획을 수립
2) 데이터 준비 : 비즈니스 요구사항과 데이터 분석에 필요한 원천데이터를 정의하고 준비하는 단계
3) 데아터 분석: 원천 데이터를 분석용 데이터 셋으로 편성하고 다양한 분석기법과 알고리즘을 이용하여 데이터 분석 -> 분석단계를 수행하는 과정에서 추가적인 데이터 확보가 필요한 경우 데이터 준비단계로 피드백하여 두 단계를 반복하여 진행
4) 시스템 구현 : 분석기획에 맞는 모델을 도출하고 이를 운영중인 가동 시스템에 적용하거나 시스템개발을 위한 사전검증으로 프로토타입 시스템을 구현
5) 평가 및 전개 : 프로젝트 성과를 평가, 정리 후 모델의 발전계획을 수립하여 차기 분석기획으로 전달 후 프로젝트 종료


10. 기업에서 데이터에 기반한 의사결정을 방해하는 요소
- 고정관념
- 편향된 생각
- 프레이밍 효과

11. 비즈니스 모델 캔버스의 채널에 대한 기능
- 기업이 제공하는 상품이나 서비스에 대한 고객의 이해를 높임
- 기업이 전달하는 밸류 프로포지션을 고객들이 평가할 수 있도록 함
- 고객이 특정한 상품이나 서비스를 구매하게 도와줌
- 고객에게 밸류 프로포지션을 전달
- 구매 고객에 대한 애프터 서비스를 제공
- 해당고객에게 접근하는 유통 채널을 공급한다(X) 
> 채널은 기업이 고객세그먼트에게 가치를 제안하기 위해 커뮤니케이션을 하고 상품이나 서비스를 전달하는 방법을 의미 커뮤니케이션, 물류, 판매채널 등 기업과 고객의 인터페이스 전반이 바로 채널이다. 유통 채널을 공급하는 것은 채널영역이 아니다

12. 비즈니스 모델 캔버스를 활용한 과제 발굴 기법
1.업무 > 2.제품 > 3.고객 > 4.규제&감사 > 5.지원 인프라

(하향식 접근법 : 문제탐색 > 문제정의 > 해결방안탐색 > 타당성검토)

13. 하향식 접근 방식의 단계에서 타당성 평가(하행식 접근법 4단계)에 대한 설명
- 도출된 분석문제나 가설에 대한 대안을 과제화하기 위해서는 다각적인 타당성 검토가 필요
- 경제적 타당성은 비용대비 효익의 관점에서 평가
- 비용항목은 데이터, 시스템, 인력, 유지보수 등과 같은 분석비용으로 구성
- 편익으로는 분석 결과를 적용함으로써 추정되는 실질적 비용절감, 추가적 매출과 수익등과 같은 경제적 가치로 산출
- 데이터 타당성에 대해서는 데이터 존재여부, 분석시스템 환경, 분석역량에 대한 검토가 필요 > 문제발생 포인트에 대한 확보는 중요하지 않다
- 기술적 타당성 분석 시 적용 가능한 요소기술 확보 방안에 대한 사전 고려가 필요

14. 하향식 데이터 분석 기획에서 문제 탐색 단계에 대한 설명
- 빠짐없이 문제를 도출하고 식별하는 것이 중요
- 세부적인 구현 및 솔루션에 초점을 맞추는 것이 아닌, 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요
- 비즈니스 모델 캔버스는 문제 탐색 도구로 활용
- 문제 탐색단계에서 현재의 비즈니스 모델 및 유사/동종사례 탐색을 통해서 도출한 분석기회들을 구체적인 과제로 만들기 전에 유즈케이스로 표시하는 것이 필요
(유즈 케이스: 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용)

15. 분석과제 정의서 에 대한 설명
- '분석과제 정의서'에는 소스데이터, 데이터 입수 및 분석의 난이도, 분석 수행주기, 분석결과에 대한 검증 오너십, 상세분석과정 등을 정의
- 분석 데이터 소스는 내/외부의 비구조적인 데이터와 소셜 미디어 및 오픈 데이터까지 범위를 확장하여 고려하고 분석방법 또한 상세하게 정의

16. 분석 마스터플랜의 세부 이행계획 수립시 고려해야 할 데이터 분석체계(분석방법론)에 대한 설명
- 분석 마스터플랜 : 분석 대상이 되는 과제를 도출 -> 우선 순위 평가 -> 단기적 세부 이행 계획 & 중.장기적 로드맵 작성
- 데이터 분석체계는 고전적인 폭포수 방식도 있으나 반복적인 정련과정을 통하여 프로젝트의 완성도를 높이는 방식을 주요 사용
- 반복적인 분석체계는 모든 단계를 반복하기보다 데이터 수집 및 확보와 분석데이터를 준비하는 단계를 순차적으로 진행
- 모델링 단계는 반복적으로 수행하는 혼합형을 많이 적용하며, 이러한 특성을 고려하여 프로젝트의 세부 일정계획도 데이터 분석체계를 고려하여 작성한다

17. 분석 프로젝트에 관리에 대한 설명
- 데이터 분석 모델의 품질을 평가하기 위해서 SPICE를 활용할 수 있다
(SPICE : 정보 시스템분야에서 소프트웨어의 품질 및 생산성 향상을 위해 소프트웨어 프로세스를 평가 및 개선하는 국제 표준)
- 분석 프로젝트 관리는 KSA ISO 21500:2013(한국 프로젝트 관리의 국가 표준)를 가이드로 활용할 수 있다
- 데이터 분석 프로젝트에서는 분석 범위가 빈번하게 변경되므로 분석프로젝트 관리에서의 일정계획보다 더 많은 시간이 소요 > Time Boxing기법과 같은 방법으로 일정관리를 진행하는 것이 필요
- 분석 프로젝트의 최종산출물이 보고서인지 또는 시스템인지에 따라 프로젝트 관리에 차이가 있다

18. 데이터 분석 과제에서 프로젝트 관리에 대한 설명
- 분석 과제에는 많은 위험이 있어 사전에 위험을 식별하고 대응방안을 수립해야 한다
- 분석과제는 적용되는 알고리즘에 따라 범위가 변할 수 있어 범위관리가 중요하다
- 분석과제에서 다양한 데이터를 확보하는 경우가 있어 조달관리 또한 중요하다 
- 분석 프로젝트 관리방안에서 시간관리는 프로젝트의 활동 일정을 수립하고 일정 통제의 진척상황을 관찰하는데 요구되는 프로세스이다

19. 데이터 분석을 위한 수준진단에서 '분석 준비도'의 분석데이터의 진단 항목
- 분석 데이터 : 분석업무를 위한 데이터 충실성, 신뢰성, 적시성, 비구조적 데이터 관리, 외부데이터 활용체계. 기준데이터 관리(MDM)
- 분석 업무 파악 : 발생한 사실 분석 업무, 예측분석업무, 시뮬레이션 분석업무, 최적화 분석 업무, 분석업무정기적개선
- 인력 및 조직 : 분석전문가 직무존재, 분석전문가 교육훈련프로그램, 관리자들의 기본적 분석능력, 전사분석업무총괄조작존재, 경영진분석업무이해능력
- 분석 기법 : 업무별 적합한 분석기법 사용, 분석업무 도입 방법론, 분석기법 라이브러리, 효과성 평가, 정기적 개선
- 분석 문화 : 사실에 근거한 의사결정, 관리자의 데이터 중시, 회의 등에서 데이터 활용, 경영진의 직관보다 데이터, 데이터 공유 및 협업문화
- IT 인프라 : 운영시스템 데이터 통합, EAL/ETL등 데이터유통체계, 분석 전용서버 및 스토리지, 빅데이터 분석환경, 통계분석환경, 비쥬얼 분석환경

20. 빅데이터의 특징 중 투자비용 요소 또는 난이도를 평가하는 요소 
- Volume
- Variety
- Velocity

21. 난이도와 시급성을 고려하였을 때 우선적으로 추진해야하는 분석과제
- 난이도는 쉽고 시급성은 현재를 나타내는 3사분면이다

22. 지속적인 분석 내재화를 위한 장기적인 마스터 플랜 방식과 과제 중심적인 접근 방식의 특징
- 장기적인 마스터 플랜 방식 : Accuracy&Deploy, Long&Term View, Problem Definition
- 과제 중심적인 접근 방식   : Speed&Test, Quick&Win, Problem Solving

23. 기업의 데이터 분석과제 수행을 위한 수준을 평가하기 위하여 분석 준비도를 파악해야 한다
데이터 분석 준비도 프레임워크에서 분석 업무 파악 영역
- 발생한 사실 분석 업무, 예측분석업무, 시뮬레이션 분석업무, 최적화 분석 업무, 분석업무정기적개선

24. 데이터 거버넌스 체계
- 데이터 거버넌스 : 표준화된 관리체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축
- 마스터 데이터, 메타데이터, 데이터 사전은 데이터 거버넌스의 중요한 관리대상 이다
- 데이터 거버넌스 체계에는 데이터 표준화, 데이터 관리체계, 데이터 저장소 관리, 표준화 활동이 있다

- 데이터 표준화는 데이터 표준용어설정, 명명규칙수립, 메타데이터구축, 데이터사전구축 등의 업무로 구성
- 데이터 관리체계는 데이터 정합성 및 활용의 효율성을 위하여 표준 데이터를 포함한 메타 데이터와 데이터 사전의 관리 원칙 수립
- 데이터 관리체계를 설명하는 항목으로는 메타데이터 관리, 데이터 사전관리, 데이터 생명주기 관리 가 있다
- 데이터 저장소 관리는 메타데이터 및 표준데이터를 관리하기 위한 전사 차원의 저장소 구성
- 저장소는 데이터 관리 체계 지원을 위한 워크플로워 및 관리용 응용소프트웨어를 지원하고 관리 대상 시스템과 인터페이스를 통한 통제가 이루어져야 함

25. 데이터 분석을 위한 조직 구조
-> 집중 구조 
-전사 분석업무를 별도의 분석전담 조직에서 담당
-전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능
-현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
->기능 구조 
-일반적인 분석 수행 구조
-별도 분석조직이 없고 해당 업무부서에서 분석 수행 
-전사적 핵심분석이 어려우며, 부서현황 및 실적통계 등 과거 실적에 국한된 분석 수행 가능성 높음
->분산 구조
-분석조직 인력들을 현업부서로 직접 배치하여 분석업무 수행
-전사차원의 우선순위 수행 
-분석결과에 따른 신속한 action가능
-베스트프랙티스 공유 가능
-부서 분석업무와 역할 분담 명확히 해야함 

26. 분석 마스터플랜 수립에서 과제 우선순위 결정
- 전략적 중요도, ROI, 실행 용이성은 분석과제 우선순위 결정에 고려할 사항 
- 업무내재화 적용수준, 분석 데이터 적용수준, 기술 적용수준 > 데이터 분석구현 로드맵을 수립한다
- 과제 우선순위 평가기준에는 전략적 중요도와 실행 용이성이 있다
- 전략적 중요도에는 전략적 필요성과 시급성
- 실행용 용이성에는 투자 용이성과 기술 용이성
- 적용 기술의 안전성 검증은 기술 용이성의 평가 요소이다
- 가치는 비즈니스 효과에 해당하며 크기, 다양성, 속도가 투자비용요소에 해당한다

27. 분석 마스터 플랜에 대한 설명
- 과제 우선순위 평가는 비즈니스 효과인 시급성과 투자비용 요소인 난이도에 근거하여 결정된다
- 분석 마스터 플랜은 분석과제 도출, 우선순위 결정, 중장기 마스터 플랜 수립과제 도출 순으로 된다
- 과제별 데이터 분석 체계는 폭포수 방식도 있으나 반복적인 정련과정을 통하여 과제의 완성도를 높이는 방식으로 많이 사용한다
- 분석 과제 로드맵은 과제의 우선순위를 고려하여 작성하되 과제별 선후관계를 감안하여 단계별 추진 내용을 정렬한다

28. 분석 기회 발굴의 범위 확장 방법에 관한 설명
- 거시적 관점의 메가트랜드 > STEEP(사회,기술,경제,환경)영역으로 나누어서 폭넓게 기회 탐색
- 경쟁자 확대 관점 > 경쟁사 및 대체재와 신규 진입자 등으로 관점을 확대하여 폭넓은 기회 탐색
- 시장의 니즈 탐색 관점 > 고객 뿐만아니라 고객과 접촉하는 역학을 수행하는 채널 및 고객의 구매와 이사결정에 영행을 미치는 영향자들에 대한 폭넓은 기회탐색
- 역량의 재해석 관점 > 내부역량 뿐만아니라 비즈니스에 영향을 끼치는 파트너 네트워크를 포함한 활용 가능한 역량을 토대로 폭넓은 분석기회를 탐색

29. 빅데이터 거버넌스에 대한 설명
- ERD는 운영 중인 데이터베이스와 일치하기 위하여 철저한 변경관리가 필요하다 
- 빅데이터 거버넌스는 산업분야별, 데이터 유형별, 정보 거버넌스 요소별로 구분하여 작성
- 단순히 대용량 데이터를 수집,축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 더욱 중요하다
- 빅데이터 분석에서 품질관리도 중요하지만, 데이터 수명주기 관리방안을 수립하지 않으면 데이터 가용성 및 관리비용 증대 문제에 직면하게 될 수 있다

30. 빅데이터를 활용한 비즈니스는 기업에 많은 변화를 가져오고 있다. 기업에서 이러한 변화를 수용하기 위한 중장기적 대응 방안 
- 분석 조직 및 인려게 대한 교육과 훈련
- 데이터 기반의 의사결정문화 정착
- 분석역량 강화를 위한 체계적인 계획 및 시행
- 빅데이터 등장으로 비즈니스 영역에서 분석조직 및 인력에 대한 지속적인 교육과 훈련을 실시
- 사실기반 의사결정을 할 수 있는 문화를 정착
- 분석교육의 목표는 단순한 툴 교육이 아닌 분석역량을 확보하고 강화하는 것에 초점

31. 분석과제 관리 프로세스에 대한 설명
- 과제발굴단계에는 분석 아이디어 발굴, 분석과제 후보제안, 분석과제 확저 프로세스가 있다
- 분석과제 중에 발생된 시사점과 분석 결과물은 풀(POOL)로 관리하고 공유된다
- 과제수행단계에는 팀구성, 분석과제 실행, 분석과제 진행관리, 결과 공유 프로세스가 있다
- 확정된 분석과제는 풀로 관리하지 않는다

32. 기존에 행해졌던 데이터 분석과 비교한 빅데이터 분석의 특징은
- 분석대상 데이터를 모든 형태 및 내외부 데이터로 확대한다
- 데이터의 생산 시점에서부터 실시간에 가까운 분석이 가능하다
- 데이터 마트에 정형 데이터를 적재하고 데이터 분석을 통하여 모델을 만들 수 있다
(데이터 마트:데이터 웨어하우스와 사용자 사이의 중간층에 위치한 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스)
-고급 분석기술은 기존에 행해졌던 데이터 분석에서도 활용되었다 

33. 빅데이터 분석에서 Self Service Analytics에 대한 설명
- 포함되어야 하는 주요 기능 : BI도구, Ad hoc Report, OLAP, Visual Discovery, Machine Learing 등
- Self Service Analyti의 성공적인 적용을 위해서는 Reference Method의 작성 및 공유, 표준 데이터의 활용, 데이터 거버넌스, 도구 사용에 대한 지속적인 교육 필요
- R, Python 등의 데이터 분석 언어와 많은 통계적 지식을 필요로 함
- 분산처리는 지원 X

34. 4차 산업혁명은 기존 산업을 초월하는 Mass Production, Mass Customization, Servitization을 구현. Servitization에 대한 설명
- Service Science의 하나로 제품과 서비스의 결합을 통한 기업의 새로운 비즈니스 모델
- 제품의 서비스화와 서비스의 상품화를 모두 포함하는 결합 비즈니스 모델
- 파이프 라인 비즈니스를 넘어 플랫폼 비즈니스를 위한 모델 
- 제품과 서비스의 결합(Product Servitization), 서비스의 상품화(Service Productization), 기존서비스와 신규서비스의 결합현상을 포괄하는 개념

35. 빅데이터 분석 방법론의 분석 기획 단계에서 프로젝트 위험 대응 계획을 수립할 때 예상되는 위험에 대한 대응 방법의 구분
- 식별된 위험은 상세한 정량적, 정성적 분석을 통해 위험 대응방안을 수립한다
- 예상되는 위험에 대해 회피(Avoid), 전이(Transfer), 완화(Mitigate), 수용(Accept)으로 구분하여 위험관리 계획서를 작성한다

36. 프로토타이핑(Prototyping) 접근법에 대한 설명 (상향식 접근법)
- 신속하게 해결책이나 모형을 제시함으로써 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화할 수 있게 한는 유용한 상향식 접근 방법이다
- 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석 시도 > 반복적으로 개선해 나가는 방법 
- 프로토타이핑 접근법의 기본적인 프로세스는 1.가설의 생성 2.디자인에 대한 실험 3.실제환경에서의 테스트 4.테스트 결과에서의 통찰도출 및 가설 확인 으로 구성

하향식 접근 방법
- 문제가 정형화되어 있고 문제해결을 위한 데이터가 완벽하게 조직에 존재하는 경우 효과적이다
- 문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화되어 수행하는 방식
- 문제 정의가 불명확하거나 이전에 접하지 못한 새로운 문제일 경우에는 적용하기 어렵다




728x90