數(shù)據(jù)挖掘具有廣闊的應(yīng)用領(lǐng)域和發(fā)展前景。SPSS Modeler因界面友好且操作簡捷,成為公認(rèn)的數(shù)據(jù)挖掘?qū)崙?zhàn)的軟件。
基于多年的教學(xué)和科研經(jīng)驗,作者深知數(shù)據(jù)挖掘理論和軟件操作相結(jié)合的重要性,努力在本書中突出以下特點:
以數(shù)據(jù)挖掘過程為線索講解Modeler軟件操作。本書以數(shù)據(jù)挖掘?qū)嵺`過程為主線,從Modeler數(shù)據(jù)管理入手,說明問題由淺入深,講解方法從易到難,旨在使讀者在較短時間內(nèi)掌握Modeler的基本功能和一般方法,并迅速運用到數(shù)據(jù)挖掘?qū)崙?zhàn)中。
數(shù)據(jù)挖掘理論的講解通俗易懂,避免數(shù)學(xué)公式的羅列。本書對Modeler中的經(jīng)典數(shù)據(jù)挖掘算法娓娓道來,旨在使讀者知其然更知其所以然,加深對數(shù)據(jù)挖掘分析結(jié)論的理解和應(yīng)用。
將數(shù)據(jù)挖掘方法、軟件操作、案例分析有機結(jié)合。本書在論述數(shù)據(jù)挖掘方法核心思想和基本原理的同時,配合案例數(shù)據(jù)展示實戰(zhàn)過程,旨在使讀者直觀理解理論,正確應(yīng)用方法。
薛薇,工學(xué)碩士,經(jīng)濟學(xué)博士,中國人民大學(xué)應(yīng)用統(tǒng)計科學(xué)研究中心副主任,中國人民大學(xué)統(tǒng)計學(xué)院副教授。關(guān)注數(shù)據(jù)挖掘及統(tǒng)計建模、統(tǒng)計和數(shù)據(jù)挖掘軟件應(yīng)用、統(tǒng)計數(shù)據(jù)庫系統(tǒng)研發(fā)等方面。涉足網(wǎng)絡(luò)新媒體輿論傳播和互動建模、政府和官方微博分析、電商數(shù)據(jù)分析、學(xué)科學(xué)術(shù)熱點跟蹤等文本挖掘,以及社會網(wǎng)絡(luò)分析和以數(shù)據(jù)挖掘為依托的客戶關(guān)系管理等領(lǐng)域。
第1章 數(shù)據(jù)挖掘和Modeler使用概述
1.1 數(shù)據(jù)挖掘的產(chǎn)生背景
1.2 什么是數(shù)據(jù)挖掘
1.3 Modeler軟件概述
第2章 Modeler的數(shù)據(jù)讀入和數(shù)據(jù)集成
2.1 變量類型
2.2 讀入數(shù)據(jù)
2.3 生成實驗方案
2.4 數(shù)據(jù)集成
第3章 Modeler的數(shù)據(jù)理解
3.1 變量說明
3.2 數(shù)據(jù)質(zhì)量的評估和調(diào)整
3.3 數(shù)據(jù)的排序
3.4 數(shù)據(jù)的分類匯總
第4章 Modeler的數(shù)據(jù)準(zhǔn)備
4.1 變量變換
4.2 變量派生
4.3 數(shù)據(jù)精
4.4 數(shù)據(jù)篩選
4.5 數(shù)據(jù)準(zhǔn)備的其他工作
第5章 Modeler的基本分析
5.1 數(shù)值型變量的基本分析
5.2 兩分類型變量相關(guān)性的研究
5.3 兩總體的均值比較
5.4 RFM分析
第6章 Modeler的數(shù)據(jù)精
6.1 變量值的離散化處理
6.2 特征選擇
6.3 因子分析
第7章 分類預(yù)測:Modeler的決策樹
7.1 決策樹算法概述
7.2 Modeler的C5.0算法及應(yīng)用
7.3 Modeler的分類回歸樹及應(yīng)用
7.4 Modeler的CHAID算法及應(yīng)用
7.5 Modeler的QUEST算法及應(yīng)用
7.6 模型的對比分析
第8章 分類預(yù)測:Modeler的人工神經(jīng)網(wǎng)絡(luò)
8.1 人工神經(jīng)網(wǎng)絡(luò)算法概述
8.2 Modeler的B-P反向傳播網(wǎng)絡(luò)
8.3 Modeler的B-P反向傳播網(wǎng)絡(luò)的應(yīng)用
8.4 Modeler的徑向基函數(shù)網(wǎng)絡(luò)及應(yīng)用
第9章 分類預(yù)測:Modeler的支持向量機
9.1 支持向量分類的基本思路
9.2 支持向量分類的基本原理
9.3 支持向量回歸
9.4 支持向量機的應(yīng)用
第10章 分類預(yù)測:Modeler的貝葉斯網(wǎng)絡(luò)
10.1 貝葉斯方法基
10.2 貝葉斯網(wǎng)絡(luò)概述
10.3 TAN貝葉斯網(wǎng)絡(luò)
10.4 馬爾科夫毯網(wǎng)絡(luò)
10.5 貝葉斯網(wǎng)絡(luò)的應(yīng)用
第11章 探索內(nèi)部結(jié)構(gòu):Modeler的聚類分析
11.1 聚類分析的一般問題
11.2 Modeler的K-Means聚類及應(yīng)用
11.3 Modeler的兩步聚類及應(yīng)用
11.4 Modeler的Kohonen網(wǎng)絡(luò)聚類及應(yīng)用
11.5 基于聚類分析的離群點探索
第12章 探索內(nèi)部結(jié)構(gòu):Modeler的關(guān)聯(lián)分析
12.1 簡單關(guān)聯(lián)規(guī)則及其有效性
12.2 Modeler的Apriori算法及應(yīng)用
12.3 Modeler的序列關(guān)聯(lián)及應(yīng)用
參考文獻
數(shù)據(jù)挖掘技術(shù)具有廣闊的應(yīng)用領(lǐng)域和發(fā)展前景,眾多有識之士紛紛選擇SPSS Modeler作為數(shù)據(jù)挖掘的工具軟件,因此SPSS Modeler軟件已經(jīng)連續(xù)多年雄踞數(shù)據(jù)挖掘應(yīng)用軟件之首。
Modeler的前身名為Clementine,2009年IBM公司收購了SPSS數(shù)據(jù)分析軟件公司,并將其廣受贊譽的SPSS統(tǒng)計分析軟件和Clementine數(shù)據(jù)挖掘軟件進行整合,將Clementine更名為
SPSS Modeler(簡稱Modeler)后再次推向全球市場。
Modeler充分利用計算機系統(tǒng)的運算處理能力和圖形展現(xiàn)能力,將方法、應(yīng)用與工具有機地融為一體,是解決數(shù)據(jù)挖掘問題的最理想工具。
Modeler不但集成了諸多計算機科學(xué)中機器學(xué)習(xí)的算法,同時也綜合了一些行之有效的統(tǒng)計分析方法,成為內(nèi)容最為、功能最為強大、使用最為方便的數(shù)據(jù)挖掘軟件產(chǎn)品。
Modeler繼續(xù)保持了SPSS產(chǎn)品的一貫風(fēng)格:界面友好且操作簡捷。原因在于Modeler始終把自己的操作者定位于實際工作部門的一線人員,而不是數(shù)據(jù)分析專家。這種所謂"傻瓜型"軟件成為Modeler不斷開拓市場的利器。
本書作者一直從事計算機數(shù)據(jù)分析的教學(xué)與科研工作,并長期跟蹤研究SPSS公司的數(shù)據(jù)分析系列產(chǎn)品,具有相當(dāng)豐富的數(shù)據(jù)分析軟件開發(fā)經(jīng)驗。因此深知,一個基礎(chǔ)相對薄弱的讀者應(yīng)該從哪些方面入手,才能很快地使用Modeler開始數(shù)據(jù)分析工作,并逐步成長為一名有經(jīng)驗的多面手。
我們認(rèn)為讀者掌握Modeler軟件應(yīng)體現(xiàn)三個層面:首先是軟件操作層面,讀者通過實際操作,盡快掌握軟件的使用方法和處理步驟;其次是結(jié)果分析層面,讀者通過案例演示,基本明白軟件的輸出結(jié)果,從而得出正確的分析結(jié)論;是方法論層面,讀者通過對某個算法基本思路的了解,進一步提高方法應(yīng)用和分析水平,升華對數(shù)據(jù)挖掘方法的認(rèn)識。所以,注重對每種方法的操作使用、結(jié)果分析和算法基本思路的講解是本書最重要的特征。
本書適用于從事數(shù)據(jù)分析的各應(yīng)用領(lǐng)域的讀者,尤其是商業(yè)銷售、財會金融、證券保險、經(jīng)濟管理、社會研究、人文教育等行業(yè)的相關(guān)人員。同時,也能夠作為高等院校計算機類、財經(jīng)類、管理類專業(yè)本科生和研究生的數(shù)據(jù)挖掘教材。
針對上述讀者群,在全書的編寫中我們努力體現(xiàn)以下特色:
1.以數(shù)據(jù)挖掘過程為線索介紹Modeler
目前,具備基本的計算機操作能力已經(jīng)不是讀者的主要障礙,數(shù)據(jù)挖掘的過程與方法才是讀者關(guān)心的主題和應(yīng)用的難點。所以,本書以數(shù)據(jù)挖掘的實踐過程為主線,從Modeler數(shù)據(jù)管理入手,說明問題從淺至深,講解方法從易到難。這樣,能使讀者在較短時間內(nèi)掌握Modeler的基本功能和一般方法,并可迅速運用到實際工作中去。
2.將數(shù)據(jù)挖掘方法、軟件操作、案例分析有機結(jié)合
目前,經(jīng)過消化的中文圖書和資料相對短缺,Modeler相關(guān)圖書一般都比較側(cè)重對其英文手冊的翻譯介紹,側(cè)重于對計算機操作過程的描述。而對數(shù)據(jù)挖掘方法則較多地羅列數(shù)學(xué)公式,輸出結(jié)果也缺少恰當(dāng)?shù)慕忉尅1緯鴦t結(jié)合實際案例,側(cè)重數(shù)據(jù)挖掘方法核心思想和基本原理的闡述,以使讀者直觀理解方法,正確掌握方法的應(yīng)用范圍。
3. 數(shù)據(jù)挖掘方法講解,語言通俗
本書對Modeler的數(shù)據(jù)挖掘算法進行了的分析和應(yīng)用,內(nèi)容力求豐富翔實。同時使用通俗的語言和示例講述算法,盡量避免使用公式和推導(dǎo)堆砌算法。
請讀者到人大經(jīng)管圖書在線(wwwrdjgcomcn)下載本書案例數(shù)據(jù)和數(shù)據(jù)流文件。數(shù)據(jù)流文件需使用Modeler 14.2以上版本打開,執(zhí)行時只需修改數(shù)據(jù)源節(jié)點中的數(shù)據(jù)文件所在目錄項,即可正確執(zhí)行流文件。
在此特別感謝中國人民大學(xué)出版社對本書出版的大力支持和各位編輯熱情細(xì)致的工作。由于水平所限,書中難免出現(xiàn)問題和錯誤,敬請各位讀者批評指正。
……
非常好,物超所值
可以跟其他書籍一起用
看完了,實用
內(nèi)容好,非常喜歡這本書,物超所值,推薦給大家!
很好
還沒仔細(xì)看,大概看了下很實用
基本是軟件介紹
的、很好的
書挺好的 印刷沒問題 物流也很快 靠譜兒 下次還是買的 哈哈 完美 摸摸噠
寶貝質(zhì)量不錯,很喜歡了。謝謝掌柜。
特別好
很好很好,很好很好很好很好很好很好很好,很好很好很好很好很好
值得閱讀!非常不錯!
很好
東西不錯,物有所值。
不好意思,確認(rèn)晚了。紙尿褲買給朋友的孩子的,查不到物流信息,剛聯(lián)系朋友才確認(rèn)已收貨,所以未能及時確認(rèn),抱歉。好評
挺好的不錯哇
Satisfied
基于SPSS Modeler的數(shù)據(jù)挖掘(第二版)希望對以后有幫助
書是正版,不過都快到了才給我打電話說少寄了一本,這不是耽誤事么
內(nèi)容講得很詳細(xì),但是怎么書中的案例數(shù)據(jù)給的網(wǎng)站上沒有呢?
我是用來教學(xué)的,這本書很適合給不懂算法的人講,講完就可以應(yīng)用了。
是clementine 的進一步改進,比較了兩本書,這本書閱讀起來更容易理解!非常好!
一本書的一角漏出來了,被弄得很臟,懶得退換了,希望做好包裝。
這本書很實用,適合初學(xué)者入門。有許多的例子,窗口界面截圖,非常清晰明了。
書挺不錯的,很好的參考書。理論與實踐相結(jié)合,很適合初學(xué)者。
比較不錯,不過受限于modeler的軟件性能,對于基于時間序列的分析,沒有更新的方法。