[書摘]《大數據玩行銷》精選:不是大就美,小而準數據含金量更高/編輯部
編按:本站自即日起與多家出版社合作,由編輯為您精選最近出版的科技相關書籍內容,經授權後小幅改編為文章形式供您閱覽;希望您在繁忙的日常生活中,能以精簡方式吸收新書精華。
以下內容摘自原書,文中第一人稱為原書作者。如果您有任何討論或意見,歡迎您在這裡留言,原書資訊請參閱文末介紹。
大數據熱潮風起雲湧,成為最夯的趨勢話題,社群媒體的興起,更推波助瀾這股熱潮,讓人以為,掌握社群大數據,就可以掌握行銷、掌握消費者。
彷彿淘金熱一般,許多企業紛紛投注資源於社群媒體爬網,試圖淘篩黃金、挖掘大商機。
大明在臉書上提到了手機,某廠商就以為是生意上門。事實上,從網路討論到真正付諸行動購買,中間仍隔著上百個因素與關卡,比如是否真有需求、是否有足夠預算……等,距離還十分遙遠。
看到數據就分析,彷彿看到黑影就開槍,可能徒勞一場。事實上,從社群媒體上得到的數據,往往並沒有辦法立即轉換為營收。
有些人似乎將社群媒體當成提升公司業績的救世主,有公司甚至連銷售點管理系統(Point of Sales, POS)都沒有,卻急著耗費鉅資,找社群媒體分析業者幫忙產生名單,找關鍵意見領袖……
但從社群媒體的數據到底吸引多少人?效果究竟如何?根本無從評量起。
其實,最能反映公司營收的數據就是公司自己的交易數據。很多企業根本還沒開始分析自己公司裡小而準(small and accurate)的交易數據,就開始投入大而亂的社群數據,是捨近求遠的作法。
20/80法則:鎖定小而準數據,才能挖到金礦
義大利著名統計經濟學家維弗雷多.柏拉圖(Vilfredo Pareto)提出「20/80法則」(又稱為「最省力法則」)。
這個法則主張:
80%的產出往往源自於20%的投入。
不成比例的投資報酬率是20/80法則的最大特色。
20/80法則應用到大數據,意指在所有的大數據裡,僅僅20%的數據就占據了高達80%的價值,剩下來80%的數據,其效用與價值就只剩區區20%。
20%的數據就掌握了80%的成果,而且通常這20%都是些明顯易見的數據,換言之,根本不需要去找遠在天邊、遙不可及的數據。
有一家公司買了一份包含1000萬個消費者的大數據,這數據裡面有100萬人是原本自家的消費者;另外的900萬則是其他競爭公司的消費者。
廠商利用這大數據進行廣告投放,最後共吸引1000個人購買產品,但是結果卻發現,1000人當中有900個是自己的顧客,只有100位是從別處轉移過來的。
數據分析更重要的應該是數據的品質,而不是數據的大小。
大數據依性質可分為三類:
小而準數據(small and accurate data);
大而亂數據(big and messy data);
開放數據(open data)。
小而準數據如POS交易數據,結構化而準確;大而亂數據就像社群媒體數據、Wifi數據,非結構化而且雜亂;開放數據則是指像天氣、人口普查之類的開放數據(詳見下圖)。
小而準數據含金量較高
大數據依性質可分為3類:小而準數據(small and accurate data)、大而亂數據(big and messy data)以及開放數據(open data)。 小數據含金量高而準確,若可以輕鬆用小數據解決問題,何苦在大數據裡找得人仰馬翻?
數據愈大,不確定性就愈高,含金量則愈少;反之,數據愈小越精準,含金量則較高。
如同淘金採礦一樣,數據煉金術,應先從含金量高的下手。此外,必須先有處理分析小而準數據的能力,才能進一步處理大而亂的數據。
大數據時代,競爭的是解決問題與決策反應效率,如果用小數據就可以輕鬆解決的事情,何必大費周章地使用投入資源和成本相對高的大數據。
此外,在小數據上應用大數據的觀念,也可以創造同樣價值,關鍵是數據必須能夠被衡量與掌控。
以小而準的數據為基礎,行有餘力,再去進行不同類型數據之間的相乘與結合,才是明智的大數據抉擇。
人的心智能力和體力有限,降維讓數據可視化、自動化
談到大數據,一般都會提到的有四大特性:數量大(Volume)、速度快(Velocity)、多樣性(Variety)、不確定性(Veracity)。
可是,很多人都忽略了第五個V(Value)的重要性,前面的4V只勾勒了大數據的樣貌與輪廓;我們應該更追根究柢的是:大數據經過清整和演算後,能夠為行銷人的決策優化帶來什麼具體貢獻與價值(詳見下圖)。
大數據4V,數據千變萬化
大數據有四大特性:數量大(Volume)、速度快(Velocity)、多樣性(Variety)、不確定性(Veracity)。資訊大爆炸,若不透過降維(Dimension Reduction),很難判讀數據意義,更別提做出決策。
進入大數據時代,龐大且不斷爆炸成長的資料數量是最大特點,大企業的交易數據隨便一運算,結果就是1000張報表。
這1000張報表,遠遠超過人類心智能量能夠理解與承受的上限。
人類的記憶系統根據維持訊息的長短,分為「短期記憶」與「長期記憶」。
其中,「短期記憶」又稱「工作記憶」。容量有限,只有7±2個意元(Chunk),就是5到9個意元。換言之,人的心智能量(Mental Capacity)是有所限制的。
舉例而言,政府制定經濟景氣指標,後面涉及龐大的經濟巨量資料運算,然而經濟景氣指標的呈現,卻只有清楚簡單的紅、黃紅、綠、黃藍、藍五種燈號,這就是報表可視化(visualization)。
將複雜的數據報告精簡到人的心智能量可以接受的範圍,又稱之為化繁為簡的「降維」(Dimension Reduction)(詳見下圖)。
降維:看得懂也能動手做
當數據超過心智能量的臨界值,就必須進行降維,如上圖黃線所示。降維有兩大作法:一是認知降維,做到可視化(visualization),將複雜的數據報告,精簡到人的心智能量可以接受的範圍;二是執行上的降維,自動化(automation)以人機分工,降維到個人體力能負荷的程度。
人只要負責辨讀燈號,即可掌握經濟景氣的好壞,並不需要曠日費時地直接判讀背後的大數據。
換言之,人或許無法看1000張企業報表,但是可以辨讀10個指標。將複雜的大數據降維、簡化到人可以處理掌握的範圍,把大數據策展(curate)起來形成一些觀點或維度,這是認知的降維。
因為人的心智能量有限,所以需要將高度複雜的數據降維;同樣的,人的時間與體力也有所限制,因此,在執行能力上也要被降維,降到一個人的體力能夠負荷的程度。
人無法同時執行100萬種行銷活動,但是機器卻可以,這是另一層次的降維是執行的降維,讓機器做機器擅長的事,人做人擅長做的事,亦即自動化(automation)。
「if-then-else」自動化方程式:人機分工,行銷人專心做決策
「if-then-else」這個簡單的邏輯可以詮釋這樣的自動化歷程。
「if」是假設一旦偵測到某位顧客進入沉睡(sleeping)的標籤,他到S3(會員存活機率低於10%的沉睡顧客)了。
「then」系統自動觸發一封沉睡顧客喚醒的eDM到他的信箱,如果偵測到他48小時內有開信,則任務完成。
否則就要進入「else」階段,再寄一次簡訊給他,先從歷史交易數據判定他是高貢獻度的顧客,系統就自動把A簡訊寄給他;如果是低貢獻度顧客,則寄B簡訊。
這個過程,若是以人力來執行,前後至少有六道工序,需耗費相當的人力資源與時間。
行銷工作包山包海,行銷人員每天忙著趕報表、制定行銷策略,還要擬定公司年度計畫……等,能如期將所有事情完成已十分難得,很難再有多餘力氣與時間進行優化的工作。
用「if-then-else」執行降維,變成只需一條程式就可以完成所有動作。
換言之,降維就是將人做的事情交給機器做,如此行銷人的價值,就可以還原到負責更有意義的行銷決策、用數據詮釋更高價值工作。
大數據時代,數據數量與複雜度大幅提升,如何降低人的認知與執行複雜度,成為迫切而重要的任務。
一是認知能力,一是執行能力,兩者的降維,前者將帶來大腦的解放,人可以思考更重要的決策;後者是體力的解放。兩種解放,讓人可以做人更擅長、更有價值的事情。
《大數據玩行銷》
──改變世界的18個大數據新思維,第一本把大數據變營業額的行銷聖經
中國大數據教父車品覺,隔海跨刀推薦
知名國際品牌都在用,大數據C2B行銷顛覆舊商業模式
行銷人的第一本大數據書,教你「玩轉」大數據
30雜誌出版
作者:陳傑豪