注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡圖形圖像、多媒體、網(wǎng)頁制作視頻/音頻/流媒體基于Rattle的可視化數(shù)據(jù)挖掘技術

基于Rattle的可視化數(shù)據(jù)挖掘技術

基于Rattle的可視化數(shù)據(jù)挖掘技術

定 價:¥39.00

作 者: 張冬慧
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302474326 出版時間: 2017-07-01 包裝:
開本: 頁數(shù): 字數(shù):  

內容簡介

  數(shù)據(jù)挖掘技術近年來發(fā)展異常迅猛,已成為大數(shù)據(jù)時代*熱門的技術和研究熱點,不僅產(chǎn)生了大量不同類型、功能強大的數(shù)據(jù)挖掘算法,而且推動了眾多數(shù)據(jù)挖掘工具軟件的發(fā)展。在這些軟件中,R語言是數(shù)據(jù)挖掘領域*重要的軟件之一。Rattle是一種用于數(shù)據(jù)挖掘的R語言的圖形交互界面,或稱為可視化數(shù)據(jù)挖掘工具。Rattle給出了從數(shù)據(jù)整理到模型評價的完整解決方案。本書主要介紹如何用Rattle包進行數(shù)據(jù)挖掘,全書共9章,通過大量精選實例,循序漸進、全面系統(tǒng)地講述數(shù)據(jù)挖掘過程。本書不僅是從事數(shù)據(jù)挖掘和大數(shù)據(jù)分析工程技術人員開發(fā)相關系統(tǒng)的技術資料,也可作為學習數(shù)據(jù)挖掘和大數(shù)據(jù)分析等課程的參考用書。

作者簡介

暫缺《基于Rattle的可視化數(shù)據(jù)挖掘技術》作者簡介

圖書目錄


目 錄第1章緒論11.1數(shù)據(jù)挖掘的認識11.1.1為什么要進行數(shù)據(jù)挖掘11.1.2數(shù)據(jù)挖掘過程11.1.3數(shù)據(jù)挖掘九大定律31.2R與Rattle31.2.1R語言31.2.2R語言的基本語法41.2.3R語言的優(yōu)勢101.2.4Rattle包101.3本章小結12 第2章入門指南132.1概述132.2認識Rstudio132.2.1Rstudio的界面132.2.2R腳本編輯區(qū)142.2.3R命令控制臺152.2.4工作空間162.2.5結果展示區(qū)182.3認識Rattle202.3.1Rattle的安裝與啟動202.3.2選項卡212.3.3工具欄24基于Rattle的可視化數(shù)據(jù)挖掘技術目錄2.3.4菜單欄242.3.5屬性面板262.4本章小結26 第3章數(shù)據(jù)準備283.1概述283.2數(shù)據(jù)283.2.1術語283.2.2變量293.2.3數(shù)據(jù)集303.3可用數(shù)據(jù)303.4數(shù)據(jù)質量313.4.1數(shù)據(jù)質量概述313.4.2數(shù)據(jù)質量評估維度313.4.3影響數(shù)據(jù)質量的因素313.5數(shù)據(jù)匹配323.6數(shù)據(jù)倉庫333.7數(shù)據(jù)訪問343.8載入數(shù)據(jù)353.8.1載入CSV數(shù)據(jù)353.8.2載入數(shù)據(jù)庫363.8.3載入SPSS類型數(shù)據(jù)383.8.4載入自帶數(shù)據(jù)集383.8.5載入網(wǎng)頁數(shù)據(jù)383.8.6載入其他格式的數(shù)據(jù)393.9本章小結39 第4章數(shù)據(jù)理解414.1概述414.2匯總數(shù)據(jù)414.2.1查看數(shù)據(jù)的簡單信息414.2.2查看數(shù)據(jù)的細節(jié)信息434.2.3查看數(shù)據(jù)的分布信息434.2.4查看數(shù)據(jù)的缺失值444.3數(shù)據(jù)分布圖464.3.1數(shù)值型變量分布圖464.3.2分類變量分布圖504.3.3散點圖矩陣524.4相關分析534.4.1相關矩陣和相關圖534.4.2缺失值的相關分析554.4.3相關樹564.5主成分分析604.6交互式探索數(shù)據(jù)624.6.1安裝GGobi634.6.2安裝rggobi634.6.3實驗指導644.7本章小結64 第5章數(shù)據(jù)檢驗665.1概述665.2KS正態(tài)性檢驗675.3Wilcoxon檢驗685.4t檢驗705.5F檢驗725.6本章小結73 第6章數(shù)據(jù)變換756.1概述756.2取值范圍調整776.3缺失值填充796.4變量類型轉換816.4.1數(shù)值變量離散化816.4.2分類變量指標化816.4.3分類變量合并836.4.4分類變量和數(shù)值變量互相轉換836.4.5變量和數(shù)據(jù)的刪除836.5離群點數(shù)據(jù)的處理846.6本章小結86 第7章數(shù)據(jù)建模877.1概述877.2聚類模型967.2.1背景967.2.2Kmeans聚類967.2.3Ewkm聚類1007.2.4層次聚類1017.2.5雙向聚類1057.3關聯(lián)規(guī)則挖掘1067.3.1背景1067.3.2基本術語1077.3.3關聯(lián)規(guī)則分類1087.3.4Apriori算法1087.3.5實驗指導1097.4傳統(tǒng)決策樹模型1147.4.1背景1147.4.2ID3算法1157.4.3C4.5算法1167.4.4實驗指導1177.5隨機森林決策樹模型1207.5.1背景1207.5.2隨機森林算法1217.5.3實驗指導1227.6自適應選擇決策樹模型1267.6.1背景1267.6.2Boosting算法1277.6.3Adaboost算法1277.6.4實驗指導1287.7SVM1317.7.1背景1317.7.2SVM算法1317.7.3實驗指導1337.8線性回歸模型1347.8.1背景1347.8.2一元線性回歸方法1357.8.3實驗指導1377.9神經(jīng)網(wǎng)絡模型1387.9.1背景1387.9.2人工神經(jīng)網(wǎng)絡模型1397.9.3實驗指導1427.10本章小結143 第8章模型評估1478.1概述1478.2數(shù)據(jù)集1488.3混淆矩陣1498.3.1二分類混淆矩陣1498.3.2模型評價指標1508.3.3多分類混淆矩陣1518.4風險圖1518.4.1風險圖的作用1518.4.2實驗指導1528.5ROC曲線1548.5.1ROC曲線的定義1548.5.2ROC曲線的作用1548.5.3實驗指導1558.6其他模型評估圖1568.7本章小結157 第9章模型部署1599.1概述1599.2模型的應用1599.3轉換為PMML1619.4電商數(shù)據(jù)挖掘案例1629.4.1背景1629.4.2數(shù)據(jù)理解1629.4.3數(shù)據(jù)準備1639.4.4清洗數(shù)據(jù)1669.4.5探索數(shù)據(jù)1679.4.6數(shù)據(jù)建模1729.5本章小結174 參考文獻175

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號