注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件Python數據分析與大數據處理從入門到精通

Python數據分析與大數據處理從入門到精通

Python數據分析與大數據處理從入門到精通

定 價:¥89.00

作 者: 朱春旭 著
出版社: 北京大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787301307656 出版時間: 2019-10-01 包裝: 平裝
開本: 16開 頁數: 464 字數:  

內容簡介

  《Python數據分析與大數據處理從入門到精通》主要講解數據分析與大數據處理所需的技術、基礎設施、核心概念、實施流程。從編程語言準備、數據采集與清洗、數據分析與可視化,到大型數據的分布式存儲與分布式計算,貫穿了整個大數據項目開發(fā)流程。本書輕理論、重實踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向對象開發(fā)、模塊化設計等,掌握Python的編程方式。然后介紹了多線程、多進程及其相互間的通信,讓讀者對分布式程序有個基本的認識。第2篇介紹了網絡數據采集、數據清洗、數據存儲等技術。第3篇介紹了Python常用的數據分析工具,擴展了更多的數據清洗、插值方法,為最終的數據可視化奠定基礎。第4篇是大數據分析的重點。首先介紹了Hadoop的框架原理、調度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進行交互,還介紹了新的結構化流式處理技術。第5篇通過三個項目實例,綜合介紹了如何分析網頁、如何搭建分布式爬蟲、如何應對常見的反爬蟲、如何設計數據模型、如何設計架構模型、如何在實踐中綜合運用前四篇涉及的技術。本書既適合非計算機專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經有編程經驗,但想轉行做大數據分析的專業(yè)人士。同時,還可以作為廣大職業(yè)院校、電腦培訓班的教學參考用書。

作者簡介

  朱春旭,高級軟件工程師,長期對企業(yè)、軟件開發(fā)公司、政府機構培訓大數據開發(fā)與應用課程,對Python大數據處理與分析相關應用有深入研究,并編寫有《極客內參-大數據開發(fā)實戰(zhàn)》教程45篇,總共30000 字。

圖書目錄

第1篇 Python程序設計 \n
第1章 Python入門 3 \n
1.1 Python概述 4 \n
1.2 搭建Python開發(fā)環(huán)境 6 \n
1.3 Python開發(fā)工具介紹 11 \n
1.4 Python軟件包的管理 13 \n
1.5 實訓:編寫“Hello World” 15 \n
本章小結 16 \n
第2章 Python基礎 17 \n
2.1 變量 18 \n
2.2 標識符 24 \n
2.3 代碼組織 26 \n
2.4 輸入與輸出 28 \n
2.5 運算符與優(yōu)先級 30 \n
2.6 新手問答 30 \n
2.7 實訓:設計一個簡易計算器 31 \n
本章小結 31 \n
第3章 數據類型與流程控制 32 \n
3.1 數字類型 33 \n
3.2 字符串類型 37 \n
3.3 集合類型 40 \n
3.4 流程控制語句 45 \n
3.5 新手問答 47 \n
3.6 實訓:設計算法,輸出乘法表 49 \n
本章小結 50 \n
第4章 函數、模塊、包 51 \n
4.1 自定義函數 52 \n
4.2 函數參數 55 \n
4.3 函數式編程 58 \n
4.4 模塊與包 63 \n
4.5 新手問答 65 \n
4.6 實訓:設計算法,對列表進行排序 67 \n
本章小結 68 \n
第5章 面向對象的程序設計 69 \n
5.1 面向對象 70 \n
5.2 自定義類 71 \n
5.3 屬性 73 \n
5.4 方法 79 \n
5.5 類的繼承 83 \n
5.6 可調用對象 86 \n
5.7 不可變對象 87 \n
5.8 新手問答 88 \n
5.9 實訓:設計算法,構造一棵二叉樹 90 \n
本章小結 92 \n
第6章 高級主題 93 \n
6.1 生成器 94 \n
6.2 迭代器 96 \n
6.3 異步處理 97 \n
6.4 錯誤、調試 103 \n
6.5 新手問答 108 \n
6.6 實訓:使用多進程技術統(tǒng)計數據并匯總 109 \n
本章小結 110 \n
第2篇 數據采集與數據清洗 \n
第7章 網絡數據采集 113 \n
7.1 HTTP請求概述 114 \n
7.2 XPath網頁解析 114 \n
7.3 Scrapy數據采集入門 119 \n
7.4 Scrapy應對反爬蟲程序 126 \n
7.5 CrawlSpider類 131 \n
7.6 分布式爬蟲 132 \n
7.7 新手問答 136 \n
7.8 實訓:構建百度云音樂爬蟲 136 \n
本章小結 139 \n
第8章 數據清洗 140 \n
8.1 數據清洗的意義 141 \n
8.2 數據清洗的內容 141 \n
8.3 數據格式與存儲類型 142 \n
8.4 數據清洗的步驟 145 \n
8.5 數據清洗的工具 147 \n
8.6 新手問答 151 \n
8.7 實訓:清洗百度云音樂數據并儲存到CSV  151 \n
本章小結 152 \n
第3篇 數據分析與可視化 \n
第9章 NumPy數值計算 155 \n
9.1 NumPy基礎 156 \n
9.2 形狀操作 164 \n
9.3 副本、淺拷貝和深拷貝 166 \n
9.4 高級索引 168 \n
9.5 排序統(tǒng)計 171 \n
9.6 新手問答 173 \n
9.7 實訓:銷售額統(tǒng)計  174 \n
本章小結 175 \n
第10章 Matplotlib可視化 176 \n
10.1 圖形的基本要素 177 \n
10.2 繪圖基礎 177 \n
10.3 設置樣式 186 \n
10.4 圖形樣例 189 \n
10.5 新手問答 198 \n
10.6 實訓:營業(yè)數據可視化 199 \n
本章小結 201 \n
第11章 Pandas統(tǒng)計分析 202 \n
11.1 Pandas數據結構 203 \n
11.2 基礎功能 210 \n
11.3 統(tǒng)計分析 217 \n
11.4 時間數據 229 \n
11.5 數據整理 231 \n
11.6 高級功能 234 \n
11.7 讀寫MySQL數據庫 236 \n
11.8 新手問答 237 \n
11.9 實訓:成績分析 237 \n
本章小結 239 \n
第12章 Seaborn可視化 240 \n
12.1 Seaborn概述 241 \n
12.2 可視化數據關系 242 \n
12.3 根據數據分類繪圖 246 \n
12.4 單變量與雙變量 251 \n
12.5 線性關系 256 \n
12.6 新手問答 258 \n
12.7 實訓:成績分析可視化 258 \n
本章小結 260 \n
第4篇 大數據存儲與快速分析篇 \n
第13章 Hadoop數據存儲與基本操作 263 \n
13.1 Hadoop概述 264 \n
13.2 Hadoop數據存儲與任務調度原理 268 \n
13.3 Hadoop基礎環(huán)境搭建 273 \n
13.4 Hadoop部署模式 294 \n
13.5 Hadoop常用操作命令 298 \n
13.6 新手問答 300 \n
13.7 實訓:動手搭建Hadoop集群環(huán)境 301 \n
本章小結 309 \n
第14章 Spark入門 310 \n
14.1 Spark概述 311 \n
14.2 Spark核心原理 312 \n
14.3 Spark基礎環(huán)境搭建 315 \n
14.4 Spark運行模式 317 \n
14.5 新手問答 321 \n
14.6 實訓:動手搭建Spark集群 322 \n
本章小結 323 \n
第15章 Spark RDD編程 324 \n
15.1 RDD設計原理 325 \n
15.2 RDD編程 328 \n
15.3 鍵值對RDD 335 \n
15.4 文件讀寫 340 \n
15.5 編程進階 342 \n
15.6 新手問答 347 \n
15.7 實訓:統(tǒng)計海鮮銷售情況 348 \n
本章小結 350 \n
第16章 Spark SQL編程 351 \n
16.1 Spark SQL概述 352 \n
16.2 創(chuàng)建DataFrame對象 360 \n
16.3 DataFrame常用API 364 \n
16.4 保存DataFrame 370 \n
16.5 新手問答 372 \n
16.6 實訓:統(tǒng)計手機銷售情況 373 \n
本章小結 375 \n
第17章 Spark流式計算編程 376 \n
17.1 流計算簡介 377 \n
17.2 Discretized Stream 379 \n
17.3 Structured Streaming 385 \n
17.4 新手問答 397 \n
17.5 實訓:實時統(tǒng)計貸款金額 397 \n
本章小結 398 \n
第5篇 項目實戰(zhàn)篇 \n
第18章 分析電商網站銷售數據 401 \n
18.1 目標分析 402 \n
18.2 數據采集 405 \n
18.3 數據分析 411 \n
本章小結 416 \n
第19章 分析旅游網站數據 417 \n
19.1 目標分析 418 \n
19.2 數據采集 420 \n
19.3 數據分析 425 \n
本章小結 429 \n
第20章 分析在售二手房數據 430 \n
20.1 目標分析 431 \n
20.2 數據采集 434 \n
20.3 數據分析 440 \n
本章小結 446 \n
附錄:Python常見面試題精選 447 \n
主要參考文獻 450

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號