환경자료 분석과 가시화를 위한 R 프로그래밍 개론서!
이 책은 R의 기초 이론 및 통계 처리 방법 등을 설명한 개론서이다. 특히 새롭게 개정된 2판은 머신러닝 기법을 포함시킨 것이 그 특징이다.
그동안 환경자료를 대상으로 분석하는 책이 없어 관련 학과 학생들뿐만 아니라 환경 분야 종사자 역시 R 프로그램을 쉽게 사용할 수 없었다. 이에 환경부에서 제공하는 환경자료를 직접 입력
자료로 활용하여 실무자들이 가질 만한 주요 질문들을 바탕으로 책을 정리하였다.
특히 실제 환경 측정자료를 활용하여 R 프로그램을 설명하고 있어 관련 분야 종사자들이 쉽게 이해할 수 있다.
이 책은 다음과 같이 구성되어 있다.
1장에서는 환경자료에 대한 정의와 자료분석의 흐름을 설명한다.
2장에서는 R 프로그램의 기초 이론을 설명한다.
3장에서는 ggplot을 이용하여 그래프를 그리는 방법을 설명한다.
4, 5, 6, 7장에서는 실제 환경자료를 활용하여 환경자료를 예측하는 방법을 보여준다.
8장에서는 머신러닝 분석 기법을 환경자료에 적용하는 방법을 설명한다.
이 책은 R 프로그램을 이용하여 방대한 환경자료 데이터를 분석하고 활용하는 방법을 알려줄 것이다.
저자 소개
저자 : 이태권
연세대학교 생물학과를 졸업하고, 동 대학 토목환경공학과에서 박사학위를 받았다. 비엔나대학교 미생물생태학과에서 연구원 생활을 거쳐 현재 연세대학교 환경공학과 교수로 재직 중이다. 주로 미생물 생태, 생물학적 정화기술, 환경자료분석 등을 연구하고 있다.
목 차
CHAPTER 01 환경 분야에서 자료 분석이란?
1.1 환경자료란?
1.2 환경자료에 대처하는 자세 및 우리의 현실
1.3 환경 분야에서의 자료 분석 흐름
CHAPTER 02 R 프로그램 기초
2.1 R이란?
2.2 R언어 기초
2.3 자료 가공하기
CHAPTER 03 ggplot을 이용하여 그래프 그리기
3.1 그래프 기본 설정하기(data & aes)
3.2 그래프 종류 결정하기(geom)
3.3 그래프 분할하기(facet)
3.4 그래프 축 표기 정렬하기
3.5 그래프의 색의 범위 결정하기(scale)
3.6 그래프 보완하기(theme)
CHAPTER 04 어느 지역의 조류 발생량이 많은가? (t-검정 및 ANOVA)
4.1 목적 설정하기
4.2 분석 방법 이론
4.3 자료 수집 및 가공
4.4 자료 분석
4.5 시각화
CHAPTER 05 조류 발생에 관련이 높은 수질 항목은 무엇인가? (상관관계)
5.1 목적 설정하기
5.2 분석방법 이론
5.3 자료 수집 및 가공
5.4 자료 분석
5.5 시각화
CHAPTER 06 환경자료를 이용해서 미래의 조류 발생량을 예측할 수 있을까? (회귀분석)
6.1 목적 설정하기
6.2 분석 방법 이론
6.3 자료 분석
6.4 시각화
CHAPTER 07 지역 ? 계절별로 수질의 특성을 비교할 수 있을까? (클러스터링 & 집단 비교)
7.1 목적 설정하기
7.2 분석 방법 이론
7.3 자료 분석
7.4 시각화
CHAPTER 08 머신러닝이 환경자료를 만난다면? (의사결정나무 & 랜덤포레스트)
8.1 목적 설정하기
8.2 분석 방법 이론
8.3 자료수집 및 가공
8.4 자료 분석
?컬러 도판
출판사 서평
다양한 측정 형태의 환경자료는 그 특징상 예측하기가 어렵다. 이 책은 이러한 환경자료를 효과적으로 분석?가공하여 의미 있는 해석을 도출할 수 있도록 환경자료 분석에 필요한 기본 이론과 필수 R 함수들을 다루고 있다. 특히 통계 초보자들도 배울 수 있도록 쉽게 기술하여 그 활용도를 높였으며 최근 활용도가 높은 머신러닝 기법을 환경자료에 적용하는 방법을 수록하였다.