< 데이터 Table >


변수: Name, Age, Sex 등, 머신러닝에서는 '피처'라고 함

데이터: 정보를 담고 있는 table 한 줄, 한 줄


* 탐색적 자료 분석 ( EDA : Exploratory Data Analysis ) 


1. 데이터 가지고 오기

- 데이터 가지고 오기 > 데이터 읽기 > 데이터를 임포트하여 메모리에 올리기


2. 데이터 모양 확인

3. 데이터 타입 확인

4. 데이터 기초 분석

5. 데이터 클린징

6. 데이터 시각화


>> 위의 6가지 과정을 토대로 '의사결정'


* 데이터 형식

- 정형 데이터 : 고정된 형식으로 저장된 데이터

- 반정형 데이터 : 고정된 형식은 아니지만 기본구조가 있는 데이터

- 비정형 데이터 : 고정된 형식이 없는 데이터


※ 데이터 양 = 컴퓨팅 파워


(출처: 가천대학교 이영호 교수님)

(출처: Do it! 쉽게 배우는 R 데이터 분석, 김영우)

+ Recent posts