第1天 |
主題 | Spark?的環境搭建與運行 |
大綱 | Spark?的本地安裝與配置 Spark?集群 Spark?編程模型 |
主題 | 數據分析系統商業案例 |
大綱 | 個性化 目標營銷和客戶細分 預測建模與分析 機器學習的系統架構 |
第2天 |
主題 | Spark?上數據的獲取、處理與準備 |
大綱 | 獲取公開數據集 處理與轉換數據 從數據中提取有用特征 |
主題 | 構建基于Spark?的推薦引擎 |
大綱 | 推薦模型的分類 提取有效特征 訓練推薦模型 使用推薦模型 推薦模型效果的評估. |
第3天 |
主題 | Spark?構建分類模型 |
大綱 | 分類模型的種類 從數據中抽取合適的特征 訓練分類模型 使用分類模型 評估分類模型的性 改進模型性能以及參數調優. |
主題 | Spark?構建回歸模型 |
大綱 | 回歸模型的種類 從數據中抽取合適的特征 回歸模型的訓練和應用 評估回歸模型的性能 改進模型性能和參數調優. |
第4天 |
主題 | Spark?構建聚類模型 |
大綱 | 聚類模型的類型 從數據中提取正確的特征 訓練聚類模型 使用聚類模型進行預測 評估聚類模型的性能 |
主題 | Spark?應用于數據降維 |
大綱 | 降維方法的種類 從數據中抽取合適的特征 訓練降維模型 使用降維模型 |
第5天 |
主題 | Spark?高級文本處理技術 |
大綱 | 處理文本數據有什么特別之處 從數據中抽取合適的特征 評估文本處理技術的作用 |
主題 | Spark?Streaming?在實時機器學習上的應用 |
大綱 | 在線學習. 流處理. 使用Spark?Streaming?進行在線學習 |