令人著迷的,有趣的……—— 《西雅圖郵訊報》
全書充滿了生動的例子……——《金融時報》
作為大數(shù)據(jù)的核心應(yīng)用,預(yù)測正在繁榮發(fā)展。它改寫了行業(yè),驅(qū)動世界向前。潮流引領(lǐng)者比如大通銀行、臉譜網(wǎng)、谷歌、HP、IBM、Match.com、網(wǎng)飛公司、優(yōu)步等正借助大數(shù)據(jù)的力量對人類的行為進行預(yù)測——其中也包括你的。公司、政府、執(zhí)法機關(guān)、醫(yī)院和高校正利用來自預(yù)測的力量,預(yù)測你否會點擊、購買、撒謊或者死去。
為什么要對人類的行為進行預(yù)測?我們有充分的理由:預(yù)測人類行為,可以戰(zhàn)勝危機、促進銷售、提升醫(yī)療保健、簡化生產(chǎn)流程、攔截垃圾信息、優(yōu)化社交網(wǎng)絡(luò)、強化打擊犯罪,以及贏得選舉,等等。
預(yù)測由世界上有效、豐富的非自然資源——數(shù)據(jù)驅(qū)動。作為人們各種日常及社會活動的副產(chǎn)品,數(shù)據(jù)正在被不斷被記錄和整理,并日漸成為一座金礦。大數(shù)據(jù)技術(shù)通過對數(shù)據(jù)進行學(xué)習(xí),正不斷釋放數(shù)據(jù)的能量。 令人著迷的, 有趣的……—— 《西雅圖郵訊報》
全書充滿了生動的例子……——《金融時報》
作為大數(shù)據(jù)的核心應(yīng)用,預(yù)測正在繁榮發(fā)展。它改寫了行業(yè),驅(qū)動世界向前。潮流引領(lǐng)者比如大通銀行、臉譜網(wǎng)、谷歌、HP、IBM、Match.com、網(wǎng)飛公司、優(yōu)步等正借助大數(shù)據(jù)的力量對人類的行為進行預(yù)測——其中也包括你的。公司、政府、執(zhí)法機關(guān)、醫(yī)院和高校正利用來自預(yù)測的力量,預(yù)測你否會點擊、購買、撒謊或者死去。
為什么要對人類的行為進行預(yù)測?我們有充分的理由:預(yù)測人類行為,可以戰(zhàn)勝危機、促進銷售、提升醫(yī)療保健、簡化生產(chǎn)流程、攔截垃圾信息、優(yōu)化社交網(wǎng)絡(luò)、強化打擊犯罪,以及贏得選舉,等等。
預(yù)測由世界上有效、豐富的非自然資源——數(shù)據(jù)驅(qū)動。作為人們各種日常及社會活動的副產(chǎn)品,數(shù)據(jù)正在被不斷被記錄和整理,并日漸成為一座金礦。大數(shù)據(jù)技術(shù)通過對數(shù)據(jù)進行學(xué)習(xí),正不斷釋放數(shù)據(jù)的能量。
在這本內(nèi)容豐富、有趣的書中,預(yù)測分析專家埃里克•西格爾解讀了預(yù)測是如何工作和影響我們每個人的。它不僅是一本技術(shù)實踐指導(dǎo)手冊,更通過提供新的研究案例以及前沿技術(shù),幫助普通讀者和專業(yè)人士更好地了解大數(shù)據(jù)預(yù)測。
!! “得到”創(chuàng)始人羅振宇、360公司創(chuàng)始人周鴻祎理性推薦,了解大數(shù)據(jù)預(yù)測必讀書目;
!!獲獎作品,全球翻譯為9種語言,美國30多所大學(xué)選為課堂教材;
!!預(yù)測分析頂ji專家生動有趣解說數(shù)據(jù)與預(yù)測技術(shù),本書是了解預(yù)測技術(shù)不容錯過的實踐指導(dǎo)手冊,修訂版增加zui新企業(yè)研究案例;
!!一點預(yù)測,無限可能。預(yù)測連接過去與未來,預(yù)測技術(shù)的應(yīng)用貫穿商業(yè)、政界、醫(yī)療、高校和執(zhí)法系統(tǒng)。身處預(yù)測繁榮發(fā)展的時代,想知道我們的世界會因為預(yù)測變成什么樣子,來讀《大數(shù)據(jù)預(yù)測》。
埃里克 西格爾, 博士, Predictive Analytics World創(chuàng)始人,《預(yù)測時報》( The Predictive Analytics Times)主編,前哥倫比亞大學(xué)教授,預(yù)測分析領(lǐng)域知名演講人、教育家和領(lǐng)導(dǎo)者。
序言
前言 預(yù)測分析的職業(yè)風(fēng)險
導(dǎo)論 預(yù)測效應(yīng)
及時章升空!預(yù)測開始發(fā)威
開始實踐
人人愛預(yù)言,雖然不
防護預(yù)測
價值100 萬美元的無聲革命
個性化的危險
預(yù)測分析程序的安裝:迂回和拖延
運行過程中
基本要素:觀察
序 言
前 言 預(yù)測分析的職業(yè)風(fēng)險
導(dǎo) 論 預(yù)測效應(yīng)
及時章 升空!預(yù)測開始發(fā)威
開始實踐
人人愛預(yù)言,雖然不
防護預(yù)測
價值100 萬美元的無聲革命
個性化的危險
預(yù)測分析程序的安裝:迂回和拖延
運行過程中
基本要素:觀察
行動就是決策
危險的啟動
呼叫休斯敦,我們有麻煩了
能做到的小模型
休斯敦,發(fā)射
熱情的科學(xué)家
讓預(yù)測走入內(nèi)心
第二章 權(quán)力越大,責(zé)任越大:惠普、Target超市、警察和美國國家安全局會窺探你的秘密
Target 超市的預(yù)測及其預(yù)測目標(biāo)
意味深長的停頓
我的15 分鐘
曝光于聚光燈下
你無法禁錮那些可傳輸?shù)臇|西
法律與秩序:政策和數(shù)據(jù)監(jiān)管
數(shù)據(jù)之戰(zhàn)
數(shù)據(jù)挖掘并不是“攫取”數(shù)據(jù)
惠普自我學(xué)習(xí)
洞悉員工還是侵犯隱私
辭職風(fēng)險:我不干了!
洞見:辭職背后的因素
危險品
辭職風(fēng)險評估的價值
預(yù)測犯罪,提前杜絕犯罪
數(shù)據(jù)犯罪和犯罪數(shù)據(jù)
無法測量的機器風(fēng)險
偏見的輪回
好的預(yù)測 壞的預(yù)測
第三章 數(shù)據(jù)效應(yīng):彩虹之后的饕餮
焦慮指數(shù)
將情緒可視化
在數(shù)據(jù)里尋寶
一切都數(shù)據(jù)化
把所有艙門都封死:信息太多了
誰的數(shù)據(jù)會成為你的囊中之物?
彩虹之末
預(yù)測之汁
遙遠、奇特和驚人的洞察力
有關(guān)系,并不意味著是因果關(guān)系
第四章 學(xué)習(xí)的機器:大通銀行對房產(chǎn)抵押風(fēng)險的預(yù)測分析
男孩與銀行的相遇
銀行面臨著風(fēng)險
預(yù)測抵御風(fēng)險
風(fēng)險業(yè)務(wù)
學(xué)習(xí)機器
創(chuàng)建機器學(xué)習(xí)
從負面經(jīng)驗中學(xué)習(xí)
機器如何學(xué)習(xí)
你可以決定決策樹的規(guī)模
計算機,為自己編程吧
學(xué)吧,寶貝
越大越好
過度學(xué)習(xí):假設(shè)太多
歸納之謎
機器學(xué)習(xí)的藝術(shù)和科學(xué)
感覺真實:測試數(shù)據(jù)
去粗取精是藝術(shù)
在大通銀行應(yīng)用分類—回歸決策樹
搖錢樹
回歸—為何顯微鏡無法觀察到宇宙碰撞
后續(xù)
第五章 集團效應(yīng):Netflix、眾包以及增壓預(yù)測
業(yè)余火箭科學(xué)家
黑馬
思想外包:集思廣益
眾包如星火燎原
生于憂患
聯(lián)合國
元學(xué)習(xí)
兩個預(yù)測模型的組合
好戲在后頭
集體信息
群體和模型的智慧
一袋子模型
集體智慧開始發(fā)威
泛化悖論:過猶不及
挑戰(zhàn)極限
第六章 “沃森”和《危險邊緣》節(jié)目
文本分析
英語的愛恨情仇
在理解問題之后就要回答
知識終極源泉
人工智能悖論
學(xué)習(xí)回答問題
學(xué)人走路,學(xué)人說話
更好的捕鼠器
應(yīng)答機器
投機取巧的《危險邊緣》
從證據(jù)中尋找答案
基礎(chǔ)知識,親愛的“沃森”
證據(jù)如山
用組合模型來判斷證據(jù)
組合模型的組合
機器學(xué)習(xí)使自然語言處理成為可能
自信但不自負
需要速度
雙重危險—“沃森”會贏嗎?
《危險邊緣》的惶恐
為了勝利
比賽之后:榮譽、嘉獎和崇拜
非對稱性IBM 人工智能
對的預(yù)測
第七章 用數(shù)字說話:挪威電信和美國合眾銀行工程師
如何通過預(yù)測來施加影響
攪拌吧,用力攪拌
沉睡的狗
要預(yù)測新的內(nèi)容
眼睛看不到
預(yù)測說服
具有說服性的選擇
商業(yè)刺激和商業(yè)反饋
定量人性
量子人性—他是否可被影響?
通過上提模型預(yù)測影響力
銀行業(yè)對影響力的運用
預(yù)測錯誤之事
響應(yīng)上提模型
上提模型的原理
上提模型如何發(fā)揮作用
說服效應(yīng)
不同行業(yè)的影響
讓移動客戶不移動
結(jié) 語
價值100 萬美元的無聲革命
當(dāng)組織采用預(yù)測分析時,其意義不啻發(fā)動了一支龐大軍隊,只不過這是由“螞蟻”組成的軍隊。這些“螞蟻”會走上組織運營的各大前線,與消費者、學(xué)生或病人等服務(wù)對象直接接觸。之后,這個“螞蟻軍團”會在預(yù)測結(jié)果的引導(dǎo)下改善數(shù)百個決策。這一過程可能并不是轟轟烈烈的,但用心觀察其綜合效果之后,會發(fā)現(xiàn)這些細小變化所產(chǎn)生的合力。每一個被改善的決策本身可能都顯得無足輕重,但成千上萬的決策合起來就大為不同。2005 年,某位客戶讓我想辦法提高他網(wǎng)站的點擊量,為此我把自己埋在了相關(guān)數(shù)據(jù)中,希望能找出辦法幫助這位客戶。這位客戶希望其網(wǎng)頁上的廣告能獲得更多的點擊量。這關(guān)乎收入,廣告的點擊量越多,這位客戶的收入就越高。這家網(wǎng)站在創(chuàng)辦幾年后已擁有數(shù)千萬用戶,用戶數(shù)據(jù)大概有5000 萬條,這就是用來做預(yù)測的寶貴的原始材料庫,而預(yù)測的對象竟然是:點擊!
廣告是媒體不可分割的部分,無論是紙媒、電視還是網(wǎng)絡(luò)媒體都離不開廣告。本杰明•富蘭克林曾說,人生中不可避免的兩樣?xùn)|西是死亡和稅。如果他現(xiàn)在還活著,一定會加上第三樣?xùn)|西:廣告。互聯(lián)網(wǎng)巨頭Google 承認,廣告是其較大的收入來源。Facebook也是如此。
但對于我要研究的這家網(wǎng)站來說,廣告的功能略有不同,只要能預(yù)測用戶的點擊率,其潛在收益就會更大。這家網(wǎng)站提供搜索高校獎學(xué)金的服務(wù),在美國所有準(zhǔn)備上大學(xué)的高中生中,大約有1/3 都是這家網(wǎng)站的用戶。這雖是不顯眼的細分市場,但對于許多大學(xué)和軍校的招生工作人員來說,卻是不容錯過的網(wǎng)站。在該網(wǎng)站上,有一則大學(xué)招生廣告很霸氣,它自稱是“美國創(chuàng)新型教育的領(lǐng)導(dǎo)者”,上面還附加了鏈接讓用戶點擊。不難想象,一些提供學(xué)生貸款的機構(gòu)也選擇在這家網(wǎng)站上投放廣告,讓報考學(xué)生沒有財務(wù)上的后顧之憂。這些廣告商為每次點擊支付25 美元。對于網(wǎng)站而言,如果一次點擊就能換來這樣豐厚的收入,那真是太棒了。此外,網(wǎng)站上的廣告與網(wǎng)站主題緊密相關(guān),而網(wǎng)站的用戶也有很強的目的性,因此平均下來每100 次點擊就能產(chǎn)生5 筆成功交易,這是令普通網(wǎng)站難以企及的業(yè)績!因此,擁有這家網(wǎng)站的獵頭公司從中獲利頗豐。任何微小的改善都意味著總收入的顯著提升。
但要想改善用戶的廣告選擇卻不是件容易的事。網(wǎng)頁切換時,用戶面前可能會出現(xiàn)很多廣告。最難的就是讓用戶點擊最適合他們的廣告鏈接。目前,網(wǎng)站根據(jù)各廣告的平均點擊率來排序,沒有考慮用戶的獨特需求。因此,點擊最多的廣告總是擺在最顯眼的位置。這樣的安排降低了廣告與單個用戶的匹配度,而且廣告一旦被推到顯眼的位置,就很難被替換下來,因為大量用戶總是會不經(jīng)意地點擊最顯眼處的鏈接。某些大學(xué)對每次點擊都愿意支付高價,而且因為位置顯眼,其廣告鏈接的點擊率也很高。因此,似乎沒有理由用冷門的廣告去替換主流廣告,因為這樣做很可能會失去唾手可得的收入。
價值100 萬美元的無聲革命
當(dāng)組織采用預(yù)測分析時,其意義不啻發(fā)動了一支龐大軍隊,只不過這是由“螞蟻”組成的軍隊。這些“螞蟻”會走上組織運營的各大前線,與消費者、學(xué)生或病人等服務(wù)對象直接接觸。之后,這個“螞蟻軍團”會在預(yù)測結(jié)果的引導(dǎo)下改善數(shù)百個決策。這一過程可能并不是轟轟烈烈的,但用心觀察其綜合效果之后,會發(fā)現(xiàn)這些細小變化所產(chǎn)生的合力。每一個被改善的決策本身可能都顯得無足輕重,但成千上萬的決策合起來就大為不同。2005 年,某位客戶讓我想辦法提高他網(wǎng)站的點擊量,為此我把自己埋在了相關(guān)數(shù)據(jù)中,希望能找出辦法幫助這位客戶。這位客戶希望其網(wǎng)頁上的廣告能獲得更多的點擊量。這關(guān)乎收入,廣告的點擊量越多,這位客戶的收入就越高。這家網(wǎng)站在創(chuàng)辦幾年后已擁有數(shù)千萬用戶,用戶數(shù)據(jù)大概有5000 萬條,這就是用來做預(yù)測的寶貴的原始材料庫,而預(yù)測的對象竟然是:點擊!
廣告是媒體不可分割的部分,無論是紙媒、電視還是網(wǎng)絡(luò)媒體都離不開廣告。本杰明•富蘭克林曾說,人生中不可避免的兩樣?xùn)|西是死亡和稅。如果他現(xiàn)在還活著,一定會加上第三樣?xùn)|西:廣告。互聯(lián)網(wǎng)巨頭Google 承認,廣告是其較大的收入來源。Facebook也是如此 。
但對于我要研究的這家網(wǎng)站來說,廣告的功能略有不同,只要能預(yù)測用戶的點擊率,其潛在收益就會更大。這家網(wǎng)站提供搜索高校獎學(xué)金的服務(wù),在美國所有準(zhǔn)備上大學(xué)的高中生中,大約有1/3 都是這家網(wǎng)站的用戶。這雖是不顯眼的細分市場,但對于許多大學(xué)和軍校的招生工作人員來說,卻是不容錯過的網(wǎng)站。在該網(wǎng)站上,有一則大學(xué)招生廣告很霸氣,它自稱是“美國創(chuàng)新型教育的領(lǐng)導(dǎo)者”,上面還附加了鏈接讓用戶點擊。不難想象,一些提供學(xué)生貸款的機構(gòu)也選擇在這家網(wǎng)站上投放廣告,讓報考學(xué)生沒有財務(wù)上的后顧之憂。這些廣告商為每次點擊支付25 美元。對于網(wǎng)站而言,如果一次點擊就能換來這樣豐厚的收入,那真是太棒了。此外,網(wǎng)站上的廣告與網(wǎng)站主題緊密相關(guān),而網(wǎng)站的用戶也有很強的目的性,因此平均下來每100 次點擊就能產(chǎn)生5 筆成功交易,這是令普通網(wǎng)站難以企及的業(yè)績!因此,擁有這家網(wǎng)站的獵頭公司從中獲利頗豐。任何微小的改善都意味著總收入的顯著提升。
但要想改善用戶的廣告選擇卻不是件容易的事。網(wǎng)頁切換時,用戶面前可能會出現(xiàn)很多廣告。最難的就是讓用戶點擊最適合他們的廣告鏈接。目前,網(wǎng)站根據(jù)各廣告的平均點擊率來排序,沒有考慮用戶的獨特需求。因此,點擊最多的廣告總是擺在最顯眼的位置。這樣的安排降低了廣告與單個用戶的匹配度,而且廣告一旦被推到顯眼的位置,就很難被替換下來,因為大量用戶總是會不經(jīng)意地點擊最顯眼處的鏈接。某些大學(xué)對每次點擊都愿意支付高價,而且因為位置顯眼,其廣告鏈接的點擊率也很高。因此,似乎沒有理由用冷門的廣告去替換主流廣告,因為這樣做很可能會失去唾手可得的收入。
未來,大數(shù)據(jù)會變得越來越重要,其核心應(yīng)用預(yù)測也會成為互聯(lián)網(wǎng)行業(yè)以及產(chǎn)業(yè)變革的重要力量,我們很有必要對數(shù)據(jù)預(yù)測及其分析方法進行且深入的了解。在這一點上,《大數(shù)據(jù)預(yù)測》是本很好的讀物,適合大數(shù)據(jù)所有相關(guān)行業(yè)的人閱讀。
——周鴻祎 360公司創(chuàng)始人、董事長兼CEO,奇酷CEO和知名天使投資人
我對不確定性懷有敬畏之心,但科學(xué)技術(shù)的發(fā)展尤其是大數(shù)據(jù)時代的來臨以及數(shù)據(jù)加工技術(shù)的進步,使人類行為可預(yù)測成為可能。我想,20年后,我們是不是會利用數(shù)據(jù)也就是預(yù)測的方法,去框定一個人的行為,或者說,我們的世界會因為預(yù)測技術(shù)改變到什么程度?讀完這本《大數(shù)據(jù)預(yù)測》,基本就能找到答案了。
——羅振宇 得到App創(chuàng)始人 未來,大數(shù)據(jù)會變得越來越重要,其核心應(yīng)用預(yù)測也會成為互聯(lián)網(wǎng)行業(yè)以及產(chǎn)業(yè)變革的重要力量,我們很有必要對數(shù)據(jù)預(yù)測及其分析方法進行且深入的了解。在這一點上,《大數(shù)據(jù)預(yù)測》是本很好的讀物,適合大數(shù)據(jù)所有相關(guān)行業(yè)的人閱讀。
——周鴻祎 360公司創(chuàng)始人、董事長兼CEO,奇酷CEO和知名天使投資人
我對不確定性懷有敬畏之心,但科學(xué)技術(shù)的發(fā)展尤其是大數(shù)據(jù)時代的來臨以及數(shù)據(jù)加工技術(shù)的進步,使人類行為可預(yù)測成為可能。我想,20年后,我們是不是會利用數(shù)據(jù)也就是預(yù)測的方法,去框定一個人的行為,或者說,我們的世界會因為預(yù)測技術(shù)改變到什么程度?讀完這本《大數(shù)據(jù)預(yù)測》,基本就能找到答案了。
——羅振宇 得到App創(chuàng)始人
關(guān)于大數(shù)據(jù)的《魔鬼經(jīng)濟學(xué)》 。
——斯坦•克雷辛格 Advertising.com創(chuàng)始執(zhí)行人
本書是21世紀(jì)生活的使用說明手冊。利用大數(shù)據(jù)進行預(yù)測幾乎成為所有領(lǐng)域的關(guān)機鍵,不管是科技、商業(yè)、財經(jīng)、運動,還是政治。而埃里克•西格爾正是我們理想的向?qū)А?/p>
——斯蒂芬•貝克 《數(shù)字迷宮與終極風(fēng)險》作者
本書有趣、有益、細膩入微,西格爾進行了深入探究,并讓科學(xué)變得激動人心。
——雷伊德•加尼 奧巴馬2012年美國大選團隊首席數(shù)據(jù)科學(xué)家
商業(yè)、政界以及醫(yī)療衛(wèi)生領(lǐng)域的《點球成金》。
——吉姆•斯特恩 eMetrics Summit創(chuàng)始人,Digital Analytics Association主席
包裝精美,內(nèi)容豐富,值得購買。
正版圖書 ,包裝不錯 , 整體感覺不錯 ,
大數(shù)據(jù)大數(shù)據(jù)
好書收藏待看
今后發(fā)展趨勢
院長推薦的書,專業(yè)