본문 바로가기

728x90

분류 전체보기

(127)
[2-1. 데이터 분석 기획의 이해] 3. 분석과제 발굴 방법론 1. 분석과제 발굴 방법론 1) 개요 - 분석과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계자들이 이해하고 프로젝트로 수행할 수 있는 과제 정의서 형태로 도출 - 분석과제를 도출하기 위한 방식으로는 크게 하향식 접근 방법 과 상향식 접근 방법 - 하향식 접근방식 : 문제가 주어져 있는 상태에서 답을 구하는 방식으로 전통적으로 수행되었던 분석과제 발굴 방식 - 하향식 접근방식의 문제점 : 대규모의 다양한 데이터를 생성하고 빠르게 변하는 기업환경에서는 문제 자체의 변화가 심해 정확하게 문제를 사전에 정이하는 것이 어려움 - 실제로는 중요한 의사결정을 할 때 하향식 접근방법과 상향식 접근방법이 혼용되어 사용된다 - 분석의 가치를 높일 수 있는 최적의 의사결정은 두 접근 방식이 상호 보완 관..
[2-1. 데이터 분석 기획의 이해] 2. 분석 방법론 - 데이터 분석 방법론을 정의할 때 반드시 필요한 내용인 절차, 방법, 도구와기법, 템플릿과 산출물을 기억 - 적용업무의 특성에 따른 모델들도 기억 1. 분석 방법론 개요 1) 개요 - 데이터 분석이 효과적으로 기업내에 정착하기 위해선 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수 - 프로젝트는 개인의 역량이나 조직의 우연한 성공에 기인X - 일정한 수준의 품질을 갖춘 산출물과 프로젝트의 성공 가능성을 확보하고 제시할 수 있어야함 - 방법론은 상세한 절차(Procedures), 방법(Methods), 도구와 기법(Tools&Techniques), 템플릿과 산출물(Templates&Outputs)로 구성 2) 데이터 기반 의사결정의 필요성 - 경험과 감에 따른 의사결정 -> 데이터 기반의..
[2-1. 데이터 분석 기획의 이해] 1. 분석기획 방향성 도출 출제 포인트 - 기업에서 분석프로젝트를 수행하기 위해 의사결정자를 섣득할 때 꼭 필요한 과정을 학습 - 데이터를 분석하기 위해 필요한 방법론과 프로세스를 꼭 알아해 한다 - 실제 비즈니스에서 분석하고자 하는 분석과제를 정의하는 방법과 마스터 플랜을 확정하는 방법을 이해 학습목표 - 분석 기획 방향성 도출을위한 분석 기획의 측징과 고려사항을 이해 - 분석 방법론 중에서 KDD분석 방법론에 대해 이해 - 분석 방법론 중에서 CRISP-DM분석 방법론에 대해 이해 - 빅데이터 분석 방법론을 이해하고 각 단계별 내용을 설명할 수 있다 데이터 분석 방법론과 프로세스의 필요성 - 대용량 데이터베이스와 빅데이터를 통해 새로운 인사이트를 도출하고자 하는 시도가 증가하여 데이터를 분석할 때, 어떤 방법론과 어떤 프로세스..
[1. 데이터 이해] 오답노트 데이터의 이해 오답노트 1. 데이터는 형태에 따라 정성데이터, 정량데이터로 구분된다 - 정량 데이터 : 정형데이터, 객관적 내용, 통계분석이 용이 - 정성 데이터 : 비정형데이터, 주관적 내용, 통계분석이 어려움 2. 암묵지와 형시지의 상호작용 관계 - 공통화 > 표출화 > 연결화 > 내면화 - 공통화 : 암묵지를 타인에게 알려주기 - 표출화 : 암묵지를 책 등 형식지로 만들기 - 연결화 : 책 등에 자신이 아는 새로운 지식 추가 - 내면화 : 책 등을 보고 타인들이 암묵적 지식 습득 3. SQL은 다양한 집계함수를 제공 - COUNT는 어떠한 데이터의 타입에도 사용이 가능하다 4. 개인정보 비식별화 기법을 설명 - 가명처리 : 개인 식별이 가능한 데이터에 대하여 직접적으로 식별 할 수 없는 다른 값으로..
[1-4. 최신 빅데이터 상식] [DBMS와 SQL] (1) DBMS 1) DBMS 이란 -DataBase Management System의 약자. -데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어 -데이터베이스를 구축하는 틀을 제공하며, 효율적인 데이터 검색, 저장, 기능 등을 제공 -ex) 오라클, 인포믹스, 액세스 2) 데이터베이스 관리시스템 종류 1.관계형 DBMS -데이터를 컬럼과 로우를 이루는 하나 이상의 테이블로 정리 -고유키가 각 로우를 식별 -로우는 레코드나 튜플로 부름 -각 테이블은 하나의 엔터티 타입(ex.고객)을 대표 -로우는 그 엔터티 종류의 인스턴스를 대표 -컬럼은 그 인스턴스의 속성이 되는 값들을 대표 2.객체지향 DBMS -일반적으로 사용되는 테이블..
[1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트] 1절. 빅데이터 분석과 전략 인사이트 1) 빅데이터 열풍과 회의론 - 빨리 끓어오른 냄비가 빨리 식는다는 거품현상을 우려 - 빅데이터 회의론 >실제 우리가 빅데이터 분석에서 찾을 수 있는 수많은 가치들을 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단할 수 있음 2) 빅데이터 회의론의 원인과 진단 1. 투자효과를 거두지 못했던 부정적 학습효과 (과거의 고객관계관리(CRM)) - 과거 CRM의 부정적 학습효과 - 공포 마케팅이 잘 통하는 영역 : 도입만 하면 모든 문제를 한번에 해소할 것 처럼 강조 - 막상 거액을 투자하여 하드웨어와 솔루션을 도입해도 어떻게 활용하고 어떻게 가치를 뽑아내야 할 지 난감 2. 빅데이터 성공사례가 기존 분석 프로젝트를 포함해 놓은 것이 많음 - 굳이 빅데이터가 필요 없..
[1-2. 데이터의 가치와 미래] 2장 데이터의 가치와 미래 학습목표 - 빅데이터 : 큰 데이터. 단순히 용량만 방대한 것이 아니라 복잡성도 증가하여 기존의 데이터 처리 툴로 다루기 어려운 데이터셋. - 빅데이터의 활용을 통해 생활이 편리해지고 있으나, 그와 반대로 사생활 침해 등의 문제 증가 - 범죄를 미리 예측해서 관리하고자 할 때 자칫 책임원칙 주의가 훼손될 수 있음 - 데이터의 오남용으로 잘못된 미래 예측이 더 큰 피해를 불러옴 - 빅데이터 시대가 진행되면서 부각되는 어두운 면 : 사생활 침해 / 책임원칙 훼손 / 데이터 오용 - 현재 초고속 인터넷 시대에서 모바일 광대역 네트워크 시대를 살고 있으며 사물인터넷(IOT) 시대가 도래했다. - 웨어러블 시장이 활발해지고 있으며 정형/비정형 데이터를 활용한 빅데이터를 통해 더 편리하고..
[1-1. 데이터의 이해] 3 - 데이터베이스의 활용 3절. 데이터베이스의 활용 1) 기업내부 데이터베이스 1. 1980년대 기업내부 데이터베이스 > OLTP(On-Line Transaction Processing) - 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나. - 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보내는 형태. - 데이터베이스 데이터를 수시로 갱신하는 프로세싱 - 데이터 갱신 위주 - ex) 주문입력시스템, 재고관리시스템 등 > OLAP(On-Line Analytical Processing) - 정보 위주의 분석 처리를 의미. - 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술 - O..
[1-1. 데이터의 이해] 2- 데이터베이스 정의와 특징 2절. 데이터베이스 정의와 특징 1) 용어의 연혁 - 1950년대:미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터(Data)의 기지(Base)라는 뜻의 데이터베이스가 탄생 - 1963년 6월:미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는 용어 공식사용. 데이터베이스 초기 개념인 '대량의 데이터를 축적하는 기지' - 1963년:GE의 C.바크만은 데이터베이스 관리 시스템 IDS 개발 - 1965년:2차 심포지엄에서 시스템을 통한 체계적인 관리와 저장 등의 의미를 담은 '데이터베이스 시스템' 용어 등장 - 1970년대 초반:유럽에서 '데이터베이스'라는 단일어가 일반화 - 1975년:미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루..
[1-1. 데이터의 이해] 1- 데이터와 정보 1장 데이터의 이해 학습목표 - 데이터의 정의 : 추론과 추정의 근거를 이루는 사실 - 데이터와 정보 그리고 지식의 관계 : 데이터 > 정보 > 지식 > 지혜로 발전하면서 데이터는 추론/예측/전망/추정을 위한 근거 1절. 데이터와 정보 1) 데이터의 정의와 특성 1. 데이터의 정의 - 1646년 영국 문헌 > 주어진 것 - 1940년대 이후 데이터의 의미는 과거의 관념적이고 추상적인 개념에서 기술적이고 사실적인 의미로 변화 - 데이터는 추론과 추정의 근거를 이루는 사실 - 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것 - 일련의 가치 창출과정에서 가장 기초를 이루는 것 2. 데이터의 특징 - 존재적 특성 : 객관적 사실(Fact, Raw Material) - 당..

728x90