本書是國內絕大多數高校采用的知名教材《云計算》(1-3版)的姊妹篇,是中國大數據專家委員會劉鵬教授聯合國內多位專家歷時兩年的心血之作。大數據領域一直缺乏一本教材,希望本書能夠填補空白。本書系統地介紹了大數據的理論知識和實戰應用,包括大數據采集與預處理、數據挖掘算法和工具和大數據可視化等,并深度剖析了大數據在互聯網、商業和典型行業的應用。劉鵬教授創辦的網站中國大數據(thebigdata.cn)、中國云計算(chinacloud.cn)和微信公眾號劉鵬看未來(lpoutlook)將免費提供本書配套PPT和其他資料。本書配套的大數據實驗體系已經在鄭州大學等高校成功應用。
劉鵬,清華大學博士,解放軍理工大學教授、學科帶頭人,中國云計算專家委員會委員。主要研究方向為信息網格和云計算,完成科研課題18項,70余篇,獲部級科技進步獎6項。曾奪得國際計算機排序比賽冠軍,并二次奪得全國高校科技比賽較高獎,獲“全軍十大學習成才標兵”、“南京十大杰出青年”和“清華大學學術新秀”等稱號。2002年首倡的“網格計算池”和2003年研發的“反垃圾郵件網格”分別為云計算和云安全的前身。創辦了知名的中國網格和中國云計算網站。
目 錄
第1章 大數據概念與應用
1.1 大數據之“大”
1.2 大數據的來源
1.3 大數據的技術支撐
1.4 大數據應用場景
1.5 如何開展大數據研發
習題
參考文獻
第2章 數據采集與預處理
2.1 大數據采集架構
2.2 數據預處理原理
2.3 數據倉庫與ETL工具
習題
參考文獻
第3章 數據挖掘算法
3.1 數據挖掘概述
3.2 分類
3.3 聚類
3.4 關聯規則
3.5 預測模型
3.6 數據挖掘算法綜合應用
習題
參考文獻
第4章 大數據挖掘工具
4.1 Mahout
4.2 Spark MLlib
4.3 其他數據挖掘工具
習題
參考文獻
第5章 R語
5.1 R語言簡介
5.2 R與數據挖掘
5.3 SparkR
習題
參考文獻
第6章 大數據可視化
6.1 數據可視化基
6.2 大數據可視化方法
6.3 大數據可視化軟件與工具
習題
參考文獻
第7章 互聯網大數據處理
7.1 互聯網信息抓取
7.2 文本分詞
7.3 倒排索引
7.4 網頁排序算法
7.5 歷史信息檢索
習題
參考文獻
第8章 大數據商業應用
8.1 用戶畫像與精準營
8.2 廣告推薦
8.3 互聯網金融
習題
參考文獻
第9章 行業大數據
9.1 地震大數據
9.2 交通大數據
9.3 環境大數據
9.4 警務大數據
習題
參考文獻
附錄:大數據實驗一體機
內容一般,理論偏多,不好理解
感謝,非常好!
沒看沒看沒看沒看沒看沒看哦
包裝很好,沒有缺損,很不錯
,,,,,,,,,,,,,,,,,,,,,,,
給我發的書和圖片不同 內容也不同 懷疑盜版
買的書和圖片不同 內容也不一樣 懷疑是盜版 還是當當自營呢 啪啪打臉吧
還可以吧。。