[3-4. 통계분석] 2. 기초 통계분석
2절 기초 통계분석 학습목표 +기술통계 - 데이터분석에서 가장 먼저 수행되는 부문 - 자료의 특성을 표, 그림, 통계량 등을 사용하에 쉽게 파악할 수 있도록 정리/요약하는 통계 분석 방법론 +기술통계를 위한 기초통계량들 - 기술통계에 활용되는 통계량은 최솟값, 최댓값, 평균, 표준편차, 분산, 중앙값, 사분위수범위, 왜도, 첨도 등 +그래프를 활용한 기술통계방법 - 막대그래프, 히스토그램, 줄기잎그림, 상자그림, 꺾은선그래프 등 +상관분석 - 두 변수 간의 관계를 분석하기 위해서 공분산과 상관계수를 활용 - 한 변수의 값이 증가할 때 상대변수의 값이 증가하면 양의상관, 상대변수의 값이 감소하면 음의상관 - 상관계술르 통해 상관성의 정도를 설명할 수 있다 1) 기술통계(Descriptive Statisti..
[3-3. 데이터 마트] 2~3. 데이터 가공 ~ 기초 분석 및 데이터 관리
2절. 데이터 가공 1) Data Exploration - 개요 : 데이터 분석을 위해 구성된 데이터의 변수들의 상태를 파악한다 - 종류 (데이터를 살펴보는 방법) 1. head(), tail() : 시작 또는 마지막 6개 recoed만 조회하는 함수 2. summary() - 수치형 변수 : 최댓값, 최솟값, 평균, 1사분위수(하위25%), 2사분위수(중앙값), 3사분위수(상위75%) # Numeric변수는 : 최솟값, 1사분위-3사분위 값, 중간값, 평균값, 최댓값, NA의 개수 # Min : 최솟값, 1st Qu : 1사분위수, Median : 중위수, Mean : 평균, 3st Qu : 3사 분위수, Max : 최댓값 > 6개 - 명목형 변수 : 명목값, 데이터 개수 - Factor변수 : 요인별..