스파크2 [Spark] 스파크 완벽 가이드 #3장 책 소개 제목 : 스파크 완벽 가이드 저자 : 빌 체임버스, 마테이 자하리아 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=175546079 스파크 완벽 가이드 스파크 창시자가 알려주는 스파크 활용과 배포, 유지 보수의 모든 것. 오픈소스 클러스터 컴퓨팅 프레임워크인 스파크의 창시자가 쓴 스파크에 대한 종합 안내서다. 스파크 사용법부터 배포, 유 www.aladin.co.kr 주요 주제 spark-submit (SparkSession과 비교?) Dataset 구조적 스트리밍 - 배치를 연속적으로 처리. 시계열 데이터 머신러닝과 고급 분석 - StringIndexer, OneHotEncoder, Vectorization, fitting, train/test RD.. 2022. 5. 6. [Spark] 스파크 완벽 가이드 #2장 책 소개 제목 : 스파크 완벽 가이드 저자 : 빌 체임버스, 마테이 자하리아 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=175546079 스파크 완벽 가이드 스파크 창시자가 알려주는 스파크 활용과 배포, 유지 보수의 모든 것. 오픈소스 클러스터 컴퓨팅 프레임워크인 스파크의 창시자가 쓴 스파크에 대한 종합 안내서다. 스파크 사용법부터 배포, 유 www.aladin.co.kr 주요 주제 클러스터란? 스파크 애플리케이션 - 드라이버/ 익스큐터/ 클러스터 매니저 언어 - 스칼라/자바/파이썬/R/SQL API - 고수준/저수준 시작하기 - SparkSession SparkSession - spark DataFrame - partition Transformation .. 2022. 5. 6. 이전 1 다음