<쉽게 배우는 R 데이터 분석 p.123>

문제 1. ggplot2의 midwest 데이터를 프레임 형태로 불러온 다음 데이터의 특징을 파악하세요.

 

 

문제 2. poptotal(전체 인구) 변수를 total로, popasian(아시아 인구) 변수를 asian으로 수정하세요.

(변수명이 바뀐 모습을 보이고 싶었는데, dplyr 패키지가 설치가 안돼서 일단은 코드만 작성했습니다.)

 

 

문제 3. total, asian 변수를 이용해 '전체 인구 대비 아시아 인구 백분율' 파생변수를 만들고, 히스토그램을 만들어 도시들이 어떻게 분포하는지 살펴보세요.

 

 

문제 4. 아시아 인구 백분율 전체 평균을 구하고, 평균을 초과하면 "large", 그 외에는 "small"을 부여하는 파생변수를 만들어 보세요.

 

 

문제 5. "large"와 "small"에 해당하는 지역이 얼마나 되는지 빈도표와 빈도 막대그래프를 만들어 확인해 보세요.

 

(large 119, small 318)

 

 

(출처; 쉽게 배우는 R 데이터 분석, 김영우)

+ Recent posts