.
第一篇 大數據與Spark概覽第1章 何為Apache Spark?第2章 Spark 簡介第3章 Spark 工具組導覽第二篇 結構化API—DataFrame、SQL與Dataset第4章 結構化API 概覽 第5章 基礎結構化操作第6章 操作不同型別的資料第7章 聚合第8章 關聯第9章 資料源第10章 Spark SQL第11章 Datasets第三篇 低階API第12章 彈性分散式資料集(RDD)第13章 進階RDD第14章 分散式共享變數第四篇 Production Applications第15章 如何在叢集上運行Spark第16章 開發Spark 應用程式第17章 部署Spark第18章 監控與除錯第19章 效能調校第五篇 串流第20章 串流處理基礎第21章 結構化串流基礎第22章 事件時間和狀態處理第23章 生產級的結構化串流第六篇 進階分析與機器學習概覽第24章 進階分析與機器學習概覽第25章 前處理與特徵工程第26章 分類第27章 迴歸第28章 推薦第29章 非監督式學習第30章 圖形分析第31章 深度學習第32章 其他特定語言: Python(PySpark) 與R(SparkR 和sparklyr)第33章 生態系與社群
實戰機器學習|使用Spark 精通Azure Analytics|在雲端上使用Azure Data Lake、HDInsight與...more