ENFJ 비전공자 개발스터디
데이터분석 준전문가 ADsP 3과목 데이터분석 데이터분석 개요 본문
반응형
- EDA (탐색적 자료분석)
다양한 차원과 값을 조합해 가며
특이한 점이나 의미있는 사실을 도출하고 분석의 최종목적을 달성해가는 과정
데이터가 가지고 있는 특성을 파악하기 위해
해당 변수의 분포등을 시각화하여 분석하는 분석방식 - 반드시 다양한 옵션을 줘서 모델링을 수행하지 않고
충분히 시간이 있으면 다양한 옵션을 줘서 시도하는 것이고
일정한 성과가 나오면 해석과 활용 단계로 진행할 수 있도록 의사결정 해야 한다. - 신규 시스템이나 스테이징 영역의 데이터는
정제되지 않았기 때문에 정제하고
DW 나 DM과 결합해야 한다. - 엑셀의 그래프는 최근 시각화 기술의 발전된 형태가 아니라 기존에 기술이다.
- 대용량 데이터에서 패턴을 파악해서 예측하는 분석 방법은 데이터마이닝 방법이다.
- 추론통계 추측통계는 모집단으로부터 추출된 표본의 표본통계량으로부터
모집단의 특성인 모수에 관한 통계적으로 추론하는 절차이다. - EDA 의 4가지 주제는
저향성의 강조
잔차 계산
자료변수의 재표현
그래프를 통한 현시성이다
Recheck
- 모델링 성능을 평가함에 있어
데이터 마이닝에서 활용하는 평가기준
정확도 accuracy
정밀도
디텍트 레이트 detect rate
리프트 lift 등의 값으로 판단하고
시뮬레이션에서는
Throughput
Average Waiting Time
Average Queue Length
Time in System 등의 지표가 활용된다 - 상자 그림 Box Plot 을 그리면 이상치를 식별하기 쉽다
- 공간 분석 Spatial analysis
지도위에 공간과 관계된 속성들을 다양한 표현으로 시각화 하는 방법
반응형
'ADsP' 카테고리의 다른 글
데이터분석 준전문가 ADsP 3과목 통계분석 (0) | 2022.02.16 |
---|---|
데이터분석 준전문가 ADsP 3과목 데이터분석 데이터마트 (0) | 2022.02.06 |
데이터분석 준전문가 ADsP 3과목 데이터분석 R프로그래밍 기초 (0) | 2022.02.06 |
데이터분석 준전문가 ADsP 2과목 데이터 분석 기획 (0) | 2022.02.06 |
데이터분석 준전문가 ADsP 1과목 데이터의 이해 (0) | 2022.01.25 |