< 데이터 Table >
변수: Name, Age, Sex 등, 머신러닝에서는 '피처'라고 함
데이터: 정보를 담고 있는 table 한 줄, 한 줄
* 탐색적 자료 분석 ( EDA : Exploratory Data Analysis )
1. 데이터 가지고 오기
- 데이터 가지고 오기 > 데이터 읽기 > 데이터를 임포트하여 메모리에 올리기
2. 데이터 모양 확인
3. 데이터 타입 확인
4. 데이터 기초 분석
5. 데이터 클린징
6. 데이터 시각화
>> 위의 6가지 과정을 토대로 '의사결정'
* 데이터 형식
- 정형 데이터 : 고정된 형식으로 저장된 데이터
- 반정형 데이터 : 고정된 형식은 아니지만 기본구조가 있는 데이터
- 비정형 데이터 : 고정된 형식이 없는 데이터
※ 데이터 양 = 컴퓨팅 파워
(출처: 가천대학교 이영호 교수님)
(출처: Do it! 쉽게 배우는 R 데이터 분석, 김영우)
'Probability & Statistics > Lecture Summary' 카테고리의 다른 글
통계적 가설 검정이란? (0) | 2019.06.01 |
---|---|
통계 분석 기법을 이용한 가설 검정 (0) | 2019.05.30 |
ggplot2 더 알아보기 (0) | 2019.05.29 |