第1章 引言
1.1 數據科學與人工智能時代
1.2 數據智慧
1.3 本書內容安排
第2章 基礎模型
2.1 機器學習方法
2.1.1 雙向聚類
2.1.2 基于鄰居的 算法
2.1.3 網絡模型
2.2 深度學習
2.2.1 機器翻譯模型
2.2.2 圖像分析模型
第3章 音樂風格識別
3.1 背景介紹
3.2 方法簡介
3.2.1 音頻數據和音頻特征
3.2.2 混合動力模型架構
3.3 描述分析
3.3.1 數據來源及簡介
3.3.2 數據加工
3.3.3 音頻特征提取
3.4 混合動力模型架構
3.4.1 兩個基礎模型的預測效果
3.4.2 混合動力模型架構的預測效果
3.4.3 工程優(yōu)化
第4章 航空數據案例分析
4.1 數據簡介
4.2 單機實現
4.2.1 基于Mysql的數據預處理
4.2.2 洛杉磯到波士頓航線的延誤分析
4.2.3 機場聚類分析
4.2.4 短路徑
4.3 分布式實現
4.3.1 基于Hive的數據預處理
4.3.2 用Spark建立分類模型
第5章 公共自行車數據案例分析
5.1 數據簡介
5.1.1 交易流水表
5.1.2 紐約市天氣數據
5.2 單機實現
5.2.1 描述統(tǒng)計分析與可視化展現
5.2.2 自行車角度的分析
5.2.3 單個站點借車量預測分析
5.3 分布式實現
5.3.1 數據預處理與描述統(tǒng)計
5.3.2 分布式預測模型
第6章 機器翻譯實例
6.1 數據簡介與數據預處理
6.1.1 刪除異常值
6.1.2 修改異常值及數據篩選