Spark: The Definitive Guide(스파크 완벽 가이드) 정리 Part1: 빅데이터와 스파크 간단히 살펴보기 Chapter 1: 아파치 스파크란 Chapter 2: 스파크 간단히 살펴보기 Chapter 3: 스파크 기능 둘러보기 Part2: 구조적 API - DataFrame, SQL, Dataset Chapter 4: 구조적 API 개요 Chapter 5: 구조적 API 기본 연산 Chapter 6: 다양한 데이터 타입 다루기 Chapter 7: 집계 연산 Chapter 8: 조인 Chapter 9: 데이터소스 Chapter 10: 스파크 SQL Chapter 11: Dataset Part3: 저수준 API Chapter 12: RDD Chapter 13: RDD 고급 개념 Chapter 14: 분산형 공유 변수 Part4: 운영용 애플리케이션 Chapter 15: 클러스터에서 스파크 실행하기 Chapter 16: 스파크 애플리케이션 개발하기 Chapter 17: 스파크 배포 환경 Chapter 18: 모니터링과 디버깅 Chapter 19: 성능 튜닝 Part5: 스트리밍 Chapter 20: 스트림 처리의 기초 Chapter 21: 구조적 스트리밍의 기초 Chapter 22: 이벤트 시간과 상태 기반 처리 Chapter 23: 운영 환경에서의 구조적 스트리밍 Part6: 고급 분석과 머신러닝 Chapter 24: 고급 분석과 머신러닝 개요 Chapter 25: 데이터 전처리 및 피처 엔지니어링 Chapter 26: 분류 Chapter 27: 회귀 Chapter 28: 추천 Chapter 29: 비지도 학습 Chapter 30: 그래프 분석 Chapter 31: 딥러닝