본문 바로가기

728x90

분류 전체보기

(127)
[01. 스포츠산업] 핵심이론 01. 스포츠산업의 이해 1. 스포츠산업의 이해 (1) 스포츠산업 : 스포츠와 관련된 재화와 서비스를 통하여 부가가치를 창출하는 산업 (2) 스포츠산업의 분류 - 스포츠시설업 : 스포츠시설 건설업, 스포츠시설 운영업 - 스포츠용품업 : 운동 및 경기용품업, 운동 및 경기용품 유통,임대업 - 스포츠서비스업 : 스포츠경기 서비스업, 스포츠정보 서비스업, 스포츠교육기관, 기타 스포츠서비스업 (3) 스포츠산업의 특성 (공복시오감) - 공간,입지 중심형 산업 : 접근성과 시설의 규모 등이 소비자들에게 주된 관심 대상이 된다 - 복합적인 산업분류 구조를 가진 산업 ㅣ 스포츠신설업, 스포츠용품업, 스포츠서비스업 간에 상호 유기적이고 복합적인 특성을 내포한다 - 시간소비형 산업 : 노동시간이 줄어들고 여가활동이 늘어나..
[3-4. 통계분석] 1~18번 문제풀이 통계분석 오답노트 1. 임금과 교육수준의 관계를 나타낸 그래프의 설명 - 각 학력 수준에 따라 임금의 분포를 나타낸다 - 학력 수준이 높아질수록 임금은 높아지는 경향이 있다 - 히스토그램의 각 막대의 높이는 빈도를 나타낸다. 임금수준은 x축을 통해서 확인할 수 있다 2. 모집단에서 표본을 추출하는 방법 - 단순랜덤추출법 : 모집단의 모든 개체가 동일한 확률로 표본에 선택되는 방법 - 계통추출법 : 모집단에서 일정한 간격(계통)으로 표본을 추출하는 방법 - 층화추출법 : 모집단을 여러 부분집단(층)으로 나눈 후, 각 층에서 무작위로 표본을 추출하는 방법 - 집락추출법 : 모집단을 서로 겹치지 않는 여러 집단(클러스터)으로 나눈 후, 일부 클러스터를 무작위로 선택 3. 확률이란 "특정사건이 일어날 가능성의 ..
[3-4. 통계분석] 6.주성분 분석 6절 주성분 분석 1) 주성분분석 (Principal Component Analysis, PCA) - 여러 변수들의 변량을 '주성분(Principal Component)'이라는 서로 상관성이 높은 변수들의 선형 결합으로 만들어 기존의 상관성이 높은 변수들을 요약, 축소하는 기법 - 첫번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록 하고, - 두번째 주성분으로는 첫 번째 주성분과는 상관성이 없어서(낮아서) 첫번째 주성분이 설명하지 못하는 나머지 변동을 정보의 손실 없이 가장 많이 설명할 수 있도록 변수들의 선형조합을 만든다 - 다차원 데이터에서 주요한 정보를 추출하고 차원을 축소하는 통계적 기법 - 변수 간의 상관성을 고려하여 데이터를 효과적으로 축소하고, 주성분을 통해 데이터의 구조를 파악하는 ..
[3-4. 통계분석] 5.다차원척도법 5절 다차원척도법 학습목표 +다처원 척도법(MDS) -다차원척도법(Multidimensional Scaling/MDS)은 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후, 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원또는 3차원 공간상에 점으로 표현하는 분석방법 +군집분석 -군집분석은 개체들 간의 비유사성을 이용하여 동일한 그룹들로 분류하는 것이 목적인 반면 -다차원척도법은 개체들의 비유사성을 이용하여 2차원 공간상에 점으로 표시하고 개체들 사이의 집단화를 시각적으로 표현하는 것을 목적 +주성분분석 -주성분분석(Principal Component Analysis,PCA)은 상관관계가 있는 변수들의 선형결합을 통해 변수를 축약하는 기법 -넓은 의미에서는 요약분석(Factor Analysis..
[3-4. 통계분석] 4.시계열분석 4절 시계열 분석 학습목표 +시계열 자료를 이해 - 시간의 흐름에 따라 관찰된 데이터를 시계열 데이터 또는 시계열 자료라고 한다 - ex : 주시가격 데이터, 실업률, 기후데이터 등 주변에 많다 +시계열 자료의 정상성을 구분 - 대부분의 시계열 자료는 비정상성 데이터 - 시계열 자료를 통해 미래를 예측하기 위해서는 비정상성 데이터를 정상성 데이터로 변화하여 분석모형을 설계 +시계열 분석 - 시계열 분석은 시계열 자료를 통해 미래를 예측하거나 시계열 데이터의 특성을 파악하는 것 - 시계열 분석은 자기회귀모형과 이동평균모형으로 구분 +회귀분석을 이해 - 시계열분석은 통계분석의 한 방법이지만 고급통계분석에 해당 - 시계열 분석을 이해하기 위해서는 회귀분석과 상관분석을 이해 1) 시계열 자료 1. 개요 - 시간..
[3-4. 통계분석] 3.회귀분석 3절 회귀분석 학습목표 +회귀분석의 정의와 가정을 이해 - 예)매출증대에 영향을 미치는 요소, 난방비에 영향을 주는 요소들, 학습능력을 향상시키는 요소들 +단순회귀분석과 다중회귀분석을 이해 - 단순회귀분석 : 하나의 요소가 결과에 미치는 영향을 모형화 - 다중회귀분석 : 여러 개의 요소가 결과에 미치는 영향을 모형화 (많이 발생) - *회귀분석에선 개념에 대한 문제,R프로그램 실행 후 Output을 해석하는 문제가 나옴 1) 회귀분석의 개요 1. 회귀분석의 정의 - 하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법 - 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 분석방법 - 독립변수의 개수가 하나이면 단순선형회귀분석, 독립변수의 ..
[3-4. 통계분석] 2. 기초 통계분석 2절 기초 통계분석 학습목표 +기술통계 - 데이터분석에서 가장 먼저 수행되는 부문 - 자료의 특성을 표, 그림, 통계량 등을 사용하에 쉽게 파악할 수 있도록 정리/요약하는 통계 분석 방법론 +기술통계를 위한 기초통계량들 - 기술통계에 활용되는 통계량은 최솟값, 최댓값, 평균, 표준편차, 분산, 중앙값, 사분위수범위, 왜도, 첨도 등 +그래프를 활용한 기술통계방법 - 막대그래프, 히스토그램, 줄기잎그림, 상자그림, 꺾은선그래프 등 +상관분석 - 두 변수 간의 관계를 분석하기 위해서 공분산과 상관계수를 활용 - 한 변수의 값이 증가할 때 상대변수의 값이 증가하면 양의상관, 상대변수의 값이 감소하면 음의상관 - 상관계술르 통해 상관성의 정도를 설명할 수 있다 1) 기술통계(Descriptive Statisti..
[3-4. 통계분석] 1.통계분석의 이해 4장 통계분석 학습목표 + 통계의 정의와 자료획득방법을 이해한다 - 간단한 테이블 또는 그래프에서 아주 복잡한 분석 결과까지 형태는 다양 - 자료획득방법으로는 총조사와 샘플량 조사가 있다 + 통계분석과 통계분석 방법을 이해한다 - 분석방법에는 기술통계와 통계적 추론으로 구분 + 확률 및 확률분포를 이해한다 + 추정과 가설검증을 이해한다 - 추정은 표본으로부터 모집단이 가지는 특성(모수)을 추측하는 것 - 가설검증은 자신이 가지는 이론적 대안이 통계적으로 의미가 있는지를 확인하는 것 1절. 통계분석의 이해 1) 통계 - 특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 - 예 : 일기예보, 물가/실업률/GNP, 의식조사와 사회조사 분석 통계, 임상실험 통계 - 조사 또는 ..
[3-3. 데이터마트] 오답노트 1. 데이터의 한 부분으로 특정 사용자가 관심을 갖고 있는 데이터를 담은 비교적 작은 규모의 데이터 웨어하우스 > 데이터 마트 - 데이터베이스 : 체계적으로 구조화된 데이터의 모임 - 데이터 마이닝 : 대규모의 데이터 집합에서 유용한 정보나 패턴을 발견하기 위해 통계학, 수학, 인공지능 등의 기술을 활용하는 프로세스 - 데이터 프레임 : 표 형태의 데이터 구조로, 행과 열로 이루어짐. 데이터를 쉽게 조작하고 분석할 수 있게 하는 자료구조 2. 변수를 조합해 변수명을 만들고 변수들을 시간, 상품 등의 차원에 결합해 다양한 요약변수와 파생변수를 쉽게 생성하여 데이터 마트를 구성할 수 있는 패키지 -> reshape패키지 : 데이터를 원하는 형태로 바꿔주는 melt함수와 원하는 부분만을 선택하는 cast함수로..
[3-3. 데이터 마트] 2~3. 데이터 가공 ~ 기초 분석 및 데이터 관리 2절. 데이터 가공 1) Data Exploration - 개요 : 데이터 분석을 위해 구성된 데이터의 변수들의 상태를 파악한다 - 종류 (데이터를 살펴보는 방법) 1. head(), tail() : 시작 또는 마지막 6개 recoed만 조회하는 함수 2. summary() - 수치형 변수 : 최댓값, 최솟값, 평균, 1사분위수(하위25%), 2사분위수(중앙값), 3사분위수(상위75%) # Numeric변수는 : 최솟값, 1사분위-3사분위 값, 중간값, 평균값, 최댓값, NA의 개수 # Min : 최솟값, 1st Qu : 1사분위수, Median : 중위수, Mean : 평균, 3st Qu : 3사 분위수, Max : 최댓값 > 6개 - 명목형 변수 : 명목값, 데이터 개수 - Factor변수 : 요인별..

728x90