샌디 라이자, 유리 레이저슨, 션 오언, 조시 윌스 박상은, 권한철, 서양주 지음 | 한빛미디어
26,000원
➝
23,400원
|
1,300P
이 책은 독자에게 대량의 데이터셋을 가지고 스파크를 활용해 복잡한 분석을 실제로 해보는 생생한 느낌을 전달한다. 단순히 모델을 구축하고 평가하는 데 그치지 않고, 전체 파이프라인을 돌아보며 데이터 정제, 전처리, 데이터 조사, 실제 제품으로 만들기까지를 보여준다. 이러한 과정을 다양한 분야에서 가져온 현실 예제에 맞게 교차 최소 제곱 추천 알고리즘, 의사 결정 나무(결정 트리), K-평균 군집화, 숨은 의미 분석, 세션화, 몬테카를로 시뮬레이션 등의 기법을 동원해 풀어본다.