본문 바로가기
나도 Data scientist ?/Self study

[2023 빅데이터 활용 시나리오 기획 전문가 과정] 사전교육(3)

by 인사 잘하는 라이언 2023. 6. 24.
728x90
반응형

[2023 빅데이터 활용 시나리오 기획 전문가 과정] 사전교육(3)

 

<5장 빅데이터 분석 방법론>

1. 방법론

개개인의 역량과 경험에 의존하지 않고 누가 수행하던 “일정수준의 질과 양”이 보장될 수 있는 체계(시스템)

 - 절차, 방법, 도구&기법, 결과물&템플릿이 구성요소임. 아래 이미지는 방법론의 모델.

 - 데이터 분석 방법론 중 하나인 KDD : Knowledge Discovery in Database

- SEMMA(SSA에서 사용하는 모델)

- CRISP-DM(Cross Industry Standard Process for Data Mining, 가장 많이 사용되는 데이터 분석 방법론 중 하나)

 a. Business Understanding : 비즈니스 관점에서 프로젝트 목적과 요구사항 이해 단계

 b. Data Understanding : 분석을 위한 데이터를 수집하고 데이터 속성 이해 과정

 c. Data preparation : 분석을 위하여 수집된 데이터 분석툴에 적합한 데이터셋 편성

 d. Modeling : 다양한 모델링 기법과 알고리즘을 선택하고 모델을 최적화

 e. Evaluation : 모델링을 통한 최적의 모델을 찾고 모델이 프로젝트의 목적에 부합되는지 평가

 f. Deployment : 모델링과 평가를 통해 완성된 모델을 실 운영환경에 적용. 모니터링 및 유지보수 방안까지 마련. 프로젝트 종료 프로세스 진행.

 

 - Process Roadmap : 빅데이터 분석 방법론의 로드맵

 

 - R&R in Analysis Projects : 프로젝트 기획자, 데이터 전문가(Data miner), 데이터 사이언티스트, IT 전문가(SW Programer), 시스템 구조전문가(보안, 인프라 등)

반응형

댓글