如今,很多企業被淹沒在數據洪流之中,數據并沒有給它們帶來太多好處。企業數字化競爭力的提升也并沒有像在公司戰略會議上渲染“大數據”這一概念時所描述的那樣快。其實,在大多數應用領域,數據量的多寡并不是衡量數據價值創造力的決定性標準。本書描繪了一條走出“大數據帶來的失望”的更智慧的路線,適用于那些已經意識到“起決定作用的不是數據量,而是正確地整合數據,物盡其用”的企業。這一路線被稱為“智能數據”。
智能數據的出發點是:“在不增加技術、人員和資金投入的情況下,我們如何高效地利用客戶數據信息?”其本身就是一種切實可行的方法論。從這個方法論出發,我們可以得出一套不斷迭代更新的、在逐步摸索中的、基于假設的行為方式。智能數據的理念是,在你所在的行業內成為數字智能化非常高的企業,在面對直接的數字化競爭時,借助數據分析,能夠一步步地打造自身的競爭優勢。
一般來說,導致數字變革宣告破產的,并非是技術力量的匱乏,而是源于企業內部的對抗、過于刻板的組織構架和失誤的變革期管理。本書介紹了企業如何通過改革自身的管理、企業文化以及組織構架以成為智能數據時代的佼佼者。在大數據時代,少即是多——只要是對的,那么更少的數據將更有成效。今天的企業需要提高“數字素養”。 如今,很多企業被淹沒在數據洪流之中,數據并沒有給它們帶來太多好處。企業數字化競爭力的提升也并沒有像在公司戰略會議上渲染“大數據”這一概念時所描述的那樣快。其實,在大多數應用領域,數據量的多寡并不是衡量數據價值創造力的決定性標準。本書描繪了一條走出“大數據帶來的失望”的更智慧的路線,適用于那些已經意識到“起決定作用的不是數據量,而是正確地整合數據,物盡其用”的企業。這一路線被稱為“智能數據”。
智能數據的出發點是:“在不增加技術、人員和資金投入的情況下,我們如何高效地利用客戶數據信息?”其本身就是一種切實可行的方法論。從這個方法論出發,我們可以得出一套不斷迭代更新的、在逐步摸索中的、基于假設的行為方式。智能數據的理念是,在你所在的行業內成為數字智能化非常高的企業,在面對直接的數字化競爭時,借助數據分析,能夠一步步地打造自身的競爭優勢。
一般來說,導致數字變革宣告破產的,并非是技術力量的匱乏,而是源于企業內部的對抗、過于刻板的組織構架和失誤的變革期管理。本書介紹了企業如何通過改革自身的管理、企業文化以及組織構架以成為智能數據時代的佼佼者。在大數據時代,少即是多——只要是對的,那么更少的數據將更有成效。今天的企業需要提高“數字素養”。
面對巨量數據,還能找到寶石和金子嗎?
如果谷歌即將踏足你的市場,該怎么辦?
成本高昂的IT工具真的能夠解決問題嗎?
羅蘭貝格專家帶你突破大數據的價值瓶頸!
比約恩 布勞卿(Björn Bloching),羅蘭貝格管理咨詢公司的高級合伙人、數字化部門全球主管,羅蘭貝格數字中樞創建者,經驗豐富的營銷專家,領導著該咨詢公司的國際市場與銷售技術中心。 拉斯 拉克(Lars Luck),麥德龍集團首席組合戰略專家,此前曾任羅蘭貝格管理咨詢公司合伙人,領導“銷售和有針對性營銷”實踐小組。 托馬斯 拉姆什(Thomas Ramge),德國著名財經雜志《brand eins》記者,報道領域涵蓋技術、IT及營銷領域?!督洕鷮W人》特約編輯。著作頗豐,曾獲得德國《金融時報》頒發的卓著商業圖書獎。
引言 以少博多的智能數據使用者
規模并不重要 // 001
成為行業“智者” // 004
智能數據理念梗概 // 005
新“數據合同” // 007
及時部分從大數據向智能數據轉變
第1 章深陷數據過載的愁云慘霧
流感預測器也鬧“流感” // 013
技術成熟度曲線(Hype-Cycling) // 019
沒有“大爆炸”的大數據 // 022
以守為攻戰術 // 027
第2 章數字化海嘯—不關注數據也行不通
沿價值鏈產生分化 // 033
機智,聯合,進攻 // 036 引 言 以少博多的智能數據使用者
規模并不重要 // 001
成為行業“智者” // 004
智能數據理念梗概 // 005
新“數據合同” // 007
及時部分 從大數據向智能數據轉變
第1 章 深陷數據過載的愁云慘霧
流感預測器也鬧“流感” // 013
技術成熟度曲線(Hype-Cycling) // 019
沒有“大爆炸”的大數據 // 022
以守為攻戰術 // 027
第2 章 數字化海嘯—不關注數據也行不通
沿價值鏈產生分化 // 033
機智,聯合,進攻 // 036
到處都土崩瓦解! // 041
投資者眼光 // 057
第3 章 智能數據冠軍—選擇正確的數據是成功的基礎
聰明的數據使用者 // 063
找對數據比擁有超多數據更有用 // 066
“3W”:為什么?如何做?做什么? // 069
概率擊敗偶然 // 075
第二部分 智能數據的循環
第4 章 五步流程實現增值
提出正確的問題 // 081
使用正確的數據 // 090
客戶需求理解 // 095
提出自己獨特的銷售主張 // 111
正確地吸引客戶 // 114
結論:實現增值 // 122
第三部分 冠軍企業的智能數據應用領域
第5 章 更加智慧地接近客戶—在合適的時間、
以合理的價格、提供所需的產品
時尚策劃 // 127
策劃式配件 // 129
哈,這個賣家是真正了解我的! // 133
貿易方面的分析小知識 // 137
在價格發現過程中,好貨也得便宜 // 140
物理網點銷售打敗網絡化銷售 // 142
第6 章 從貿易伙伴轉變為數據伙伴—通過中介共同提高
客戶潛力
一切對抗一切? // 147
協同型客戶關系管理 // 150
瑞士法典 // 156
假名的力量 // 158
雙重選擇性加入?是的! // 163
第7 章 智能優化選址、產品線和產品
“錯誤的旗桿” // 167
在正確的地點采用正確的銷售模式 // 171
實時優化產品線 // 176
第8 章 多渠道到底是什么意思—為客戶和企業提供好
的“客戶旅程”
多渠道發展—內外有別 // 187
彈球機而不是保齡球 // 190
每人一個蘋果賬戶! // 193
客戶旅程中的渠道斷點 // 198
在線產品展示廳 // 202
第四部分 企業的智能化之路
第9 章 能夠接受錯誤才是正確的經營態度
彈道式思維 // 211
用不斷嘗試打敗加農炮理論 // 215
無計劃時代的企業管理 // 217
孔子說…… // 224
數據大狂歡 // 227
第10 章 使組織更加靈活—選擇正確的組織構架、流程
和技術
可以自由選擇工作崗位嗎? // 229
智能數據的折中路線 // 232
數字化變革中的“四步走” // 233
迭代增量,小步快跑! // 243
第11 章 智能化地引進人才和開展培訓—正確選擇員工
戰略規劃官 // 246
數據科學家 // 247
項目經理 // 251
變革管理經理 // 252
第五部分 贏得數據
第12 章 選擇客戶真正需要的數字化戰略
公眾眾口鑠金 // 257
隱私精神分裂癥 // 259
透明的“數據章魚”? // 262
贏得數據 // 265
后NSA時代的人 // 271
全新模式 // 273
客戶細分黑盒子
客戶細分的目的是,基于現有數據的特征,將客戶識別為盡可能同質的,或是盡可能彼此異質的群組(簇)。在將相似的要素進行分組或在發現數據中潛藏的模式方面,存在著不同的操作方法,這些方法源自機器學習領域“無監督學習”范疇。最重要的幾個分類操作方法如下:
1. 分層聚類分析
這種操作方法是基于前期已經識別出來的數據特征(例如通過識別市場上同質化群組的社會人口統計學特征、使用行為和觀念)測算出被觀察者(個人或公司)之間的差異,并據此建立矩陣。這個矩陣也分為許多行,同數據庫中被觀察者的分類占比保持一致。被觀察者之間的差異涵蓋了所有已識別的數據特征,并且可以通過不同的方法計算出來。在分層聚合的過程中,一對兒被觀察者在一個循環流程中被反復概括比對,就連最小的差異也會被發現。這個流程會一直不停地循環重復,直到所有的被觀察者都被納入某一個簇中。這個積聚的過程可以通過多種不同的算法實現。比較常見的算法包括單聯聚類法(即SL聚類,又稱鄰近算法)和凝聚層次聚類(沃德法)。根據算法之間不同的聚合邏輯,會產生不同的聚合結果。采用單聯聚類法可以識別出一些較小的邊緣群體,若采用凝聚層次聚類法,那么簇的規模一般會比較均衡。
分層分析方法的優點是,不需要事先就知道簇數,而是借助于統計學參數預估出理想的簇數,從統計學的角度出發,理想簇數的確定需要考慮到組內同質和組間異質之間的平衡問題。分層分析方法的缺點是,計算量非常大,且只適用于小規模的數據量。很多時候,分層分析方法被用于分析通過社會調查形式獲得的數據。分層分析流程也適用于從大數據中進行隨機抽樣,目的是獲得穩定的分類并且確定簇的數量。后續,數據科學家會采取分區操作,將聚合結果擴展到整個數據庫。
2. 劃分聚類分析
在分層聚類分析過程中,不需要事先就確定簇的數量,這對模式探索型的聚合分析流程來說是一大優點。然而,在劃分聚類分析中,必須要預先就確定好簇的數量。總體來看,劃分聚類分析的各種方法間存在共性,都是根據預先確定好的簇的數量選擇出相應數量的對象,將每個對象的初始值作為單一簇的平均值或者中心點,然后反復調整聚類劃分,直到誤差函數最小化為止。其中,最著名且應用最廣泛的誤差函數是K均值(K-Means)算法:先根據既定的簇數隨機選擇出相應數量的對象,將這些對象的初始值作為每個簇的平均值,對剩余的每個對象,根據其與初始均值之間的差異程度,將其歸入相應的簇。然后再重新計算每個簇的誤差函數平均值。這個過程不斷重復,直到每個簇中各對象的差異不顯著(或者說誤差最小化)。劃分聚類分析中還有一種算法是K中位數(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的較大好處是,它尤其適合大規模的數據分析,因為它在算法方面不像分層聚類分析那么復雜。但是K均值算法的問題在于對異常值的敏感度過大,偶爾會導致十分小的聚類被劃分出來。 客戶細分黑盒子
客戶細分的目的是,基于現有數據的特征,將客戶識別為盡可能同質的,或是盡可能彼此異質的群組(簇)。在將相似的要素進行分組或在發現數據中潛藏的模式方面,存在著不同的操作方法,這些方法源自機器學習領域“無監督學習”范疇。最重要的幾個分類操作方法如下:
1. 分層聚類分析
這種操作方法是基于前期已經識別出來的數據特征(例如通過識別市場上同質化群組的社會人口統計學特征、使用行為和觀念)測算出被觀察者(個人或公司)之間的差異,并據此建立矩陣。這個矩陣也分為許多行,同數據庫中被觀察者的分類占比保持一致。被觀察者之間的差異涵蓋了所有已識別的數據特征,并且可以通過不同的方法計算出來。在分層聚合的過程中,一對兒被觀察者在一個循環流程中被反復概括比對,就連最小的差異也會被發現。這個流程會一直不停地循環重復,直到所有的被觀察者都被納入某一個簇中。這個積聚的過程可以通過多種不同的算法實現。比較常見的算法包括單聯聚類法(即SL聚類,又稱鄰近算法)和凝聚層次聚類(沃德法)。根據算法之間不同的聚合邏輯,會產生不同的聚合結果。采用單聯聚類法可以識別出一些較小的邊緣群體,若采用凝聚層次聚類法,那么簇的規模一般會比較均衡。
分層分析方法的優點是,不需要事先就知道簇數,而是借助于統計學參數預估出理想的簇數,從統計學的角度出發,理想簇數的確定需要考慮到組內同質和組間異質之間的平衡問題。分層分析方法的缺點是,計算量非常大,且只適用于小規模的數據量。很多時候,分層分析方法被用于分析通過社會調查形式獲得的數據。分層分析流程也適用于從大數據中進行隨機抽樣,目的是獲得穩定的分類并且確定簇的數量。后續,數據科學家會采取分區操作,將聚合結果擴展到整個數據庫。
2. 劃分聚類分析
在分層聚類分析過程中,不需要事先就確定簇的數量,這對模式探索型的聚合分析流程來說是一大優點。然而,在劃分聚類分析中,必須要預先就確定好簇的數量??傮w來看,劃分聚類分析的各種方法間存在共性,都是根據預先確定好的簇的數量選擇出相應數量的對象,將每個對象的初始值作為單一簇的平均值或者中心點,然后反復調整聚類劃分,直到誤差函數最小化為止。其中,最著名且應用最廣泛的誤差函數是K均值(K-Means)算法:先根據既定的簇數隨機選擇出相應數量的對象,將這些對象的初始值作為每個簇的平均值,對剩余的每個對象,根據其與初始均值之間的差異程度,將其歸入相應的簇。然后再重新計算每個簇的誤差函數平均值。這個過程不斷重復,直到每個簇中各對象的差異不顯著(或者說誤差最小化)。劃分聚類分析中還有一種算法是K中位數(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的較大好處是,它尤其適合大規模的數據分析,因為它在算法方面不像分層聚類分析那么復雜。但是K均值算法的問題在于對異常值的敏感度過大,偶爾會導致十分小的聚類被劃分出來。
另外,該算法是基于隨機選取的初始值,因此在反復調整過程中,劃分結果不是很穩定。此外,結果缺乏可再現性也是缺點之一。分層聚類分析可以補償劃分聚類分析的缺陷,因此可以將分層聚類分析中產生出的聚合分類結果作為K均值分析方法的簇數起點值。
3. 密度聚類分析
密度聚類分析背后的邏輯是,將被觀察者視為一個空間內的點,盡管這些觀察者之間存在很多差異化特征。首先我們要識別出這個空間內的高密度區和低密度區,并以此為基礎建立起簇。這種分析方法的核心流程就是所謂的“具有噪聲的基于密度的聚類方法”(Density-Based Spatial Clustering of Applications with Noise,簡稱DBSCAN)。根據這個空間內點之間的距離,我們會識別出密度較高的區域,并將這個高密區內的點作為核心點。還有一些點處于中等密度區域,我們將這些點稱為邊界點,被歸至周邊的簇。還有一些點,分布非常稀疏,我們將這些點稱為噪聲點。DBSCAN分析方法的優點之一,是不需要提前就確定簇的數量,這與分層聚類分析法有異曲同工之妙。與K均值分析法相比,DBSCAN方法具有一個關鍵優勢,即可以識別非線性聚類,并可以有效對抗異常值。但是當空間簇的密度不均勻、間距差相差很大時,DBSCAN聚類質量較差。DBSCAN是相對比較新的聚類分析方法(1996 年才被提出),目前已經發展成為機器學習領域最重要的算法之一。
4. 模糊聚類分析
目前既存的系統化聚類分析流程都是將一個因素明確地歸入某一個簇中,這是所謂的“硬流程”。模糊聚類分析屬于“軟流程”,即某一個因素可以被歸入一個以上的簇,換句話說,就是在識別聚類從屬性的不同等級。模糊聚類分析中最有名的算法是模糊C均值(FCM)。首先假定每一個被觀察對象都能夠或者傾向于被歸入一個簇,那么處于簇中心位置的被觀察者歸入這個簇的可能性高一些,處于簇邊緣的被觀察者納入這個簇的可能性相對低一些,或者說簇邊緣的被觀察者也有可能被納入其他簇。
從技術層面上看,模糊聚類分析的邏輯與K均值算法類似。模糊聚類分析這一設想的目的是,實現一個被觀察對象被歸入不止一個簇中,這在某些特定的應用案例中更具現實價值。如果市場和客戶細分部門希望獲得明確的聚類結果(例如要去評估某一聚類集合的市場潛力),在對客戶針對不同商品種類的消費行為和購買決策進行統計分析時,多維的聚類可能更有意義。例如,為了精準定位并營銷旅行社潛在客戶,我們可以利用模糊聚類分析方法,通過分析交易數據信息,從而去識別客戶的旅行類型。此時,有些客戶或被歸入多個特征組,例如海灘度假組、城市游組等,這可以幫助我們為客戶提供多樣化的選擇。