<쉽게 배우는 R 데이터 분석 p.123>
문제 1. ggplot2의 midwest 데이터를 프레임 형태로 불러온 다음 데이터의 특징을 파악하세요.
문제 2. poptotal(전체 인구) 변수를 total로, popasian(아시아 인구) 변수를 asian으로 수정하세요.
문제 3. total, asian 변수를 이용해 '전체 인구 대비 아시아 인구 백분율' 파생변수를 만들고, 히스토그램을 만들어 도시들이 어떻게 분포하는지 살펴보세요.
문제 4. 아시아 인구 백분율 전체 평균을 구하고, 평균을 초과하면 "large", 그 외에는 "small"을 부여하는 파생변수를 만들어 보세요.
문제 5. "large"와 "small"에 해당하는 지역이 얼마나 되는지 빈도표와 빈도 막대그래프를 만들어 확인해 보세요.
(출처; 쉽게 배우는 R 데이터 분석, 김영우)
'Programming Language > R' 카테고리의 다른 글
06. 자유자재로 데이터 가공하기 (0) | 2019.05.27 |
---|---|
분석 도전! (쉽게 배우는 R 데이터 분석 p.160) (0) | 2019.05.26 |
05. 데이터 분석 기초 - 데이터 파악하기, 다루기 쉽게 수정하기 (0) | 2019.04.18 |
04. 데이터 프레임의 세계 (0) | 2019.04.18 |
R이란? (0) | 2019.03.28 |