當今社會,大數據技術已廣泛應用于各行各業(yè),大數據相關的存儲和分布式計算等基本知識也成為了時下大學生尤其是計算機相關專業(yè)學生應具備的常識。本書在內容上去繁就簡,重點介紹大數據的相關基本概念和原理,包括存儲原理和分布式處理的原理。本書主要圍繞Hadoop大數據處理平臺(第2章),介紹其中涉及的HDFS(第3章)、HBase(第4章)等存儲技術和Hadoop MapReduce分布式處理技術(第6章);介紹了大數據相關的存儲技術NoSQL數據庫(第5章)以及數據倉庫技術Hive(第7章);并對新興的大數據平臺Spark(第8章)以及其他流行的大數據技術(第9章)進行了介紹。 本書適合計算機專業(yè)的低年級學生作為大數據入門課程的教材或者其他專業(yè)學生的大數據課程教材。