[2023 빅데이터 활용 시나리오 기획 전문가 과정] 사전교육(3)
<5장 빅데이터 분석 방법론>
1. 방법론
개개인의 역량과 경험에 의존하지 않고 누가 수행하던 “일정수준의 질과 양”이 보장될 수 있는 체계(시스템)
- 절차, 방법, 도구&기법, 결과물&템플릿이 구성요소임. 아래 이미지는 방법론의 모델.
- 데이터 분석 방법론 중 하나인 KDD : Knowledge Discovery in Database
- SEMMA(SSA에서 사용하는 모델)
- CRISP-DM(Cross Industry Standard Process for Data Mining, 가장 많이 사용되는 데이터 분석 방법론 중 하나)
a. Business Understanding : 비즈니스 관점에서 프로젝트 목적과 요구사항 이해 단계
b. Data Understanding : 분석을 위한 데이터를 수집하고 데이터 속성 이해 과정
c. Data preparation : 분석을 위하여 수집된 데이터 분석툴에 적합한 데이터셋 편성
d. Modeling : 다양한 모델링 기법과 알고리즘을 선택하고 모델을 최적화
e. Evaluation : 모델링을 통한 최적의 모델을 찾고 모델이 프로젝트의 목적에 부합되는지 평가
f. Deployment : 모델링과 평가를 통해 완성된 모델을 실 운영환경에 적용. 모니터링 및 유지보수 방안까지 마련. 프로젝트 종료 프로세스 진행.
- Process Roadmap : 빅데이터 분석 방법론의 로드맵
- R&R in Analysis Projects : 프로젝트 기획자, 데이터 전문가(Data miner), 데이터 사이언티스트, IT 전문가(SW Programer), 시스템 구조전문가(보안, 인프라 등)
'나도 Data scientist ? > Self study' 카테고리의 다른 글
[2023 빅데이터 활용 시나리오 기획 전문가 과정] 사전교육(2) (0) | 2023.06.22 |
---|---|
우문현답 with Chat-GPT : 데이터 분석에 관심 있는 당신, R과 파이썬 어떤 언어를 배워야 할까? (1) | 2023.06.18 |
[2023 빅데이터 활용 시나리오 기획 전문가 과정] 사전교육(1) (0) | 2023.06.16 |
[2023 빅데이터아카데미] 빅데이터 활용 시나리오 기획 전문가 과정 선발 (0) | 2023.06.14 |
SQL 점심 study 1 _20220116 (0) | 2023.01.26 |
댓글