本書從大數(shù)據(jù)技術相關概念出發(fā),系統(tǒng)介紹了構建大數(shù)據(jù)平臺的相關技術,并在此基礎上進行離線數(shù)據(jù)分析和在線數(shù)據(jù)分析。全書共三篇,分為7章,內容包括技術基礎篇、分布式集群篇、平臺構建篇,第壹篇包括大數(shù)據(jù)技術概述、大數(shù)據(jù)分析技術,第二篇包括Linux技術基礎、Hadoop技術基礎及構建Hadoop集群、Spark技術基礎及構建Spark集群,第三篇包括構建基于Spark的實時交易數(shù)據(jù)統(tǒng)計平臺、構建基于Hadoop的離線電商大數(shù)據(jù)分析平臺。 本書以理論為基礎,以實例為引導,完整闡述了如何從無到有搭建大數(shù)據(jù)平臺,并在此平臺基礎上進行應用。本書配套資源豐富,包括教學PPT、所有程序的源代碼、相關集群虛擬機、擴展學習視頻、課后練習題及答案,可方便授課教師教學及學生自學。 本書可作為高校數(shù)據(jù)科學與大數(shù)據(jù)技術等相關專業(yè)的教材,也可作為對大數(shù)據(jù)技術感興趣的相關人員的參考用書。