본문 바로가기

728x90

ADsP(데이터 분석 준전문가)/개념정리

(26)
[3-3. 데이터 마트] 2~3. 데이터 가공 ~ 기초 분석 및 데이터 관리 2절. 데이터 가공 1) Data Exploration - 개요 : 데이터 분석을 위해 구성된 데이터의 변수들의 상태를 파악한다 - 종류 (데이터를 살펴보는 방법) 1. head(), tail() : 시작 또는 마지막 6개 recoed만 조회하는 함수 2. summary() - 수치형 변수 : 최댓값, 최솟값, 평균, 1사분위수(하위25%), 2사분위수(중앙값), 3사분위수(상위75%) # Numeric변수는 : 최솟값, 1사분위-3사분위 값, 중간값, 평균값, 최댓값, NA의 개수 # Min : 최솟값, 1st Qu : 1사분위수, Median : 중위수, Mean : 평균, 3st Qu : 3사 분위수, Max : 최댓값 > 6개 - 명목형 변수 : 명목값, 데이터 개수 - Factor변수 : 요인별..
[3-3. 데이터 마트] 1. 데이터 변경 및 요약 3장 데이터 마트 학습목표 • 데이터 마트를 구성하는 요약변수와 파생변수를 구분할 수 있다. - 데이터 마트를 구성할 때 가장 중요한 부분 중 하나가 요약변수와 파생변수를 생성하 는 부분 - 요약변수 : 데이터를 특정 기준에 따라 사칙연 산을 통해 만들어 낸 변수 - 파생변수 : 사용자의 노하우를 기반으로 새롭게 만들 어 낸 변수 • reshape 패키지를 활용하여 데이터 마트를 생성할 수 있다. - reshape 패키지는 데이터 마트를 생성할 수 있도록 데이터를 녹이고(melt) 다시 형상화(cast)할 수 있는 R 패키지로, 분석용 마트 설계에서 잘 활용 • sqldf 패키지와 plyr 패키지를 활용하여 데이터를 핸들링할 수 있다. - R 프로그램에서도 SQL을 사용하기 위해 sqldf라는 패키지를 ..
[3-2. R프로그래밍 기초] 2장 R프로그래밍 기초 학습목표 - 데이터 분석 환경을 이해한다 - 데이터 분석 도구 R의 특성을 이해한다 - R을 설치하고 GUI를 이해한다 / R Studio를 설치하고 GUI를 이해한다 1절. R 소개 (1) 데이터 분석 도구의 현황 1. R의 탄생 - R은 오픈소스 프로그램으로 통계/데이터마이닝과 그래프를 위한 언어이다 - 다양한 최신 통계분석과 마이닝 기능을 제공한다 - 다양한 기능을 지원하는 많은 패키지가 수시로 업데이트 된다 2. 분석도구의 비교 3. R의 특징 1) 오픈소스 프로그램 - 사용자가 커뮤니티에 도움 요청이 쉽다. - 많은 패키지가 수시로 업데이트 된다. 2) 그래픽 및 성능 - 프로그래밍이나 그래픽 측면 등 대부분의 주요 특징들에서 상용 프로그램과 대등하거나 월등하다 3) 시스..
[3-1. 데이터 분석 개요 ] 데이터 분석 개요 학습목표 - 데이터 처리 프로세스를 이해한다 - 데이터 분석 기법 중 시각화를 이해한다 - 데이터 분석 기법 중 공간분석을 이해한다 - 데이터 분석 기법 중 탐색적 자료 분석을 이해한다 눈높이 체크 1. 데이터 분석을 위해 데이터 마트 - 데이터 분석을 위해 데아터웨어하우스(DW)나 데이터마트(DM)에서 데이터 추출 - 운영시스템에서 데이터를 추출하여 분석용 데이터 구성 2. 데이터 분석 방법 중 시각화 - 데이터를 도표나 그림으로 한눈에 분석내용을 인지할 수 있는 데이터 분석기법 - 가장 낮은 수준의 분석 - 복잡한 분석보다 더 효율적으로 인사이트 얻음 - 빅데이터 분석에서 필수적인 분석 방법 3. 데이터 분석 방법 중 공간분석 - 공간적 차원과 관련된 속성을 지도 위에 시각화하여 인..
[2-2. 분석 마스터 플랜] 2. 분석 거버넌스 체계 수립 1. 거버넌스 체계 1) 개요 - 기업에서 데이터를 이용한 의사결정이 강조될수록 데이터 분석과 활용을 위한 체게적인 관리가 중요 - 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 중요 - 조직 내 분석관리체계를 수립해야 하는 이유는 데이터 분석을 기업의 문화로 정착하고 데이터 분석업무를 지속적으로 고도화하기 위해서이다 2) 구성요소 - 마스터 플랜 수립 시점에서 데이터 분석의 지속적인 적용과 확산을 위한 거버넌스 체계는 분석기획 및 관리를 수행하는 조직, 과제기획 및 운영프로세스, 분석관련 시스템, 데이터, 분석관련 교육 및 마인드 육성체계로 구성 2. 데이터 분석 수준집단 1) 개요 - 기업들은 데이터 분석의 도입여부와 활용에 명확한 분석수준을 점검할 필요가 있다 - 데이터분석의 수준집단을..
[2-2. 분석 마스터 플랜] 1. 마스터 플랜 수립 프레임 워크 출제 포인트 : 분석과제들의 우선순위 기준, 우선순위 평가기준, 우선순위 설정방법, 이행계획수립방법이 중요 학습목표 - 데이터 분석을 위한 마스터 플랜수립을 이해한다 - 분석과제의 시급성과 난이도에 따른 분석과제 우선순위를 선정 할 수 있다 - 데이터 분석 거버넌스 체계를 이해한다 - 데이터 분석 조직구조와 교육내용을 이해한다 데이터분석을 위한 마스터 플랜 수립이 필요한 이유 > 데이터분석을 구현하기 위한 다양한 기준들을 통해 데이터 분석을 위한 로드맵 수립 분석과제의 우선순위 선정 > 비즈니스 관점에서 도출된 다양한 분석과제들을 기업에 적용시키기 위해서는 적용 우선순위를 평가해야 함 데이터 분석 거버넌스 체계가 필요한 이유 > 분석 거버넌스 체계를 통하여 기업의 현 분석수준을 정확히 진단하고 분석 조직..
[2-1. 데이터 분석 기획의 이해] 4. 분석 프로젝트 관리 방안 1. 분석과제 관리를 위한 5가지 주요 영역 - 분석프로젝트는 범위, 일정, 품질, 리스크, 의사소통 등 영역별 관리가 수행 될 뿐만 아니라 - 다양한 데이터에 기반한 분석기법을 적용하는 특성 때문에 5가지 주요 속성을 고려한 추가적인 관리가 필요 - 5가지 영역 1. Data Size : 분석하고자 하는 데이터의 양, 하둡 환경과 기존 정형 데이터베이스 환경에서의 시간 당 생성되는 데이터 분석의 관리방식에서 차이가 남 2. Data Complexity : 잘 적용될 수 있는 분석 모델의 선정 3. Speed : 시나리오 측면에서의 속도, 분석 모델의 성능 및 속도를 고려한 개발 4. Analytic Complexity : 해석이 가능하면서도 정확도를 올릴 수 있는 최적모델, 분석 모델의 정확도와 복잡도..
[2-1. 데이터 분석 기획의 이해] 3. 분석과제 발굴 방법론 1. 분석과제 발굴 방법론 1) 개요 - 분석과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계자들이 이해하고 프로젝트로 수행할 수 있는 과제 정의서 형태로 도출 - 분석과제를 도출하기 위한 방식으로는 크게 하향식 접근 방법 과 상향식 접근 방법 - 하향식 접근방식 : 문제가 주어져 있는 상태에서 답을 구하는 방식으로 전통적으로 수행되었던 분석과제 발굴 방식 - 하향식 접근방식의 문제점 : 대규모의 다양한 데이터를 생성하고 빠르게 변하는 기업환경에서는 문제 자체의 변화가 심해 정확하게 문제를 사전에 정이하는 것이 어려움 - 실제로는 중요한 의사결정을 할 때 하향식 접근방법과 상향식 접근방법이 혼용되어 사용된다 - 분석의 가치를 높일 수 있는 최적의 의사결정은 두 접근 방식이 상호 보완 관..
[2-1. 데이터 분석 기획의 이해] 2. 분석 방법론 - 데이터 분석 방법론을 정의할 때 반드시 필요한 내용인 절차, 방법, 도구와기법, 템플릿과 산출물을 기억 - 적용업무의 특성에 따른 모델들도 기억 1. 분석 방법론 개요 1) 개요 - 데이터 분석이 효과적으로 기업내에 정착하기 위해선 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수 - 프로젝트는 개인의 역량이나 조직의 우연한 성공에 기인X - 일정한 수준의 품질을 갖춘 산출물과 프로젝트의 성공 가능성을 확보하고 제시할 수 있어야함 - 방법론은 상세한 절차(Procedures), 방법(Methods), 도구와 기법(Tools&Techniques), 템플릿과 산출물(Templates&Outputs)로 구성 2) 데이터 기반 의사결정의 필요성 - 경험과 감에 따른 의사결정 -> 데이터 기반의..
[2-1. 데이터 분석 기획의 이해] 1. 분석기획 방향성 도출 출제 포인트 - 기업에서 분석프로젝트를 수행하기 위해 의사결정자를 섣득할 때 꼭 필요한 과정을 학습 - 데이터를 분석하기 위해 필요한 방법론과 프로세스를 꼭 알아해 한다 - 실제 비즈니스에서 분석하고자 하는 분석과제를 정의하는 방법과 마스터 플랜을 확정하는 방법을 이해 학습목표 - 분석 기획 방향성 도출을위한 분석 기획의 측징과 고려사항을 이해 - 분석 방법론 중에서 KDD분석 방법론에 대해 이해 - 분석 방법론 중에서 CRISP-DM분석 방법론에 대해 이해 - 빅데이터 분석 방법론을 이해하고 각 단계별 내용을 설명할 수 있다 데이터 분석 방법론과 프로세스의 필요성 - 대용량 데이터베이스와 빅데이터를 통해 새로운 인사이트를 도출하고자 하는 시도가 증가하여 데이터를 분석할 때, 어떤 방법론과 어떤 프로세스..

728x90