2015年3月8日 星期日

2015/3/8 「阿里巴巴的大數據十步!」

阿里巴巴的大數據十步!

摘錄自:天下雜誌每日報電子報                        2015/3/7
2015-03-02 Web only  作者:羅之盈

天下雜誌每日報電子報 - 20150308
圖片來源:shutterstock
 網路時代,企業還沒完全理解,就又出現了人人喊進的「大數據」,究竟企業該如何因應,阿里巴巴集團數據副總裁有解。
 
「數據將改變世界」,阿里巴巴集團創辦人馬雲將大數據做為重要戰略項目,再一波掀起數據挖掘與應用熱潮。

阿里集團數據技術及產品部副總裁車品覺,在《大數據的關鍵思考》揭露數據思考「十誡」,並在短期參訪台灣時,對企業運用大數據提出教戰手冊。

《天下雜誌》根據訪談內容,整理出企業應用大數據的十個步驟:

第一步:數據自知:那個數字最重要

「起步點:有沒有量化自己,」車品覺說,企業的「數據自知」是關鍵。如果是電商公司,它需要定義什麼數據是重要的數據,可能是商品數、來客數、轉換率、回頭客。

但若是公司最大成本來自運費時,重要的數據可能就是退貨數,「數據不是萬能。企業需要設定三個月以及一年之內最重要的三個議題,從中提煉數據。」

第二步:口袋有多深:數據不嫌多,但要花錢

How much is too much?到底要搜集多大的數據量才夠?」車品覺坦言這個問題曾經困擾他很多年,後來他的理解是需要搜集多少數據取決於口袋有多深。數據絕對不會嫌太多,但需要很多成本,其中包括搜集、儲存、加工、更新成本等。企業需要了解自己專案的資源,反推搜集範圍。有時寧願數據搜集的範圍小、準確、穩定,也比「大而不全」好。

第三步:確認應用方向

確定成本後,需要了解應用方向,例如:有些商場嘗試iBeacon藍芽定位技術追蹤了商場消費者的移動軌跡,但有訊息卻不知怎麼使用。

第四步:可以用數據解決的事,不要用「大數據」

大數據應用需要成本,而且大數據不是神話,有些事務用幾行幾列的表格就能解決,何必使用成本高的大數據。

第五步:搞懂十個環節

變化的時代,什麼是五年後不會改變的?只有是數據十個歷程不會改變:「埋點(設定蒐集的情境)/蒐集、儲存/刷新、辨識(確定需要的內容)/關聯、挖掘(針對特定項目蒐集)/決策與算法、應用與行動/反饋」,雖然每個環節操作細節會改變,但過程不會改變。

第六步:捨近而求遠

企業設定搜集情境時,時常就近以「公司目標」為搜集核心,譬如:買書的人,同時也買什麼。但卻可能有導致錯誤歸因。例如:有些購物網站發現,買書的人不愛買生鮮品。

但他應該跳出網站既有的數據,去猜測原因。譬如:了解顧客是不是住在超市旁邊。因為如果住在超市旁,他當然不會上網買生鮮品。這就是繞遠路,多了解「人的體驗」。

第七步:尋找別人不要的「冗餘」

一般企業都會遇到數據不夠的問題,這時就要尋找別人不要的數據「冗餘」,只要數量夠大,冗餘就有意義。例如:拿一張民國五十年的百元鈔票,交換現在的百元鈔票,究竟要換不換?有些人認為已經不流通的鈔票沒有價值,不願交換,有些人則認為其有收藏價值,所以具有10倍、20倍、100倍價值,而願意交換。

車品覺表示,到底有多少價值?其實可以從拍賣網站上取得近期成交價格,做為交換的判斷,這些公開的數據資訊,就是所謂對別人沒有意義、但對自己有意義的「冗餘」。

第八步:「快」不一定有用

車品覺認為「天下武功,唯快不破」不完全適用於大數據。例如:大數據偵測到某個人從台北前往台中,於是就將他的設定住所改成台中。其實,他可能只是短暫停留,等到他回到台北時看到的卻是台中訊息。所以刷新速度需要根據不同蒐集情境,制定不同更新節奏。

第九步:尋找人才首重思考邏輯

車品覺分享他找人的面試考題:一是「請用三分鐘介紹自己」,數據人員需要有效率地說清楚產品,如果就連產品是「自己」都說不清楚,何況其他。二是「台灣的人口數有多少?」(地點隨著應徵者居住地而變),這題探究的是思考邏輯,答案並不重要,絕大部分應徵者都會直接回答,但資深的數據人員則會反問,「要應用在哪裡」、「什麼時間點的人口」、「為什麼問」等,他們懂得答案在不同的命題下有不同的結果,懂得追問問題。

第三題是「假如本周要向某個網路公司CEO做數據簡報,請問你會提出哪三個關鍵數據?」這一題同樣是在考邏輯,但是卻是在了解數據結合商業的邏輯,有人回答營收、有人回答成本,答案可能都對,重點在於提煉商業數據的思考過程。

第十步:每個數據團隊長相都不一樣

數據團隊和企業裡的資訊後勤部門不同,每家公司資訊部門員工技能可能雷同,都需要懂得處理電腦疑難雜症,所以可能有通用的資訊團隊。

但數據團隊需要「量身」組成,沒有長相一樣的數據團隊,因此重要的是培養「團隊文化」。車品覺指出,數據團隊由不同專業背景的人組成,管理數據團隊的重點在於,讓每個人了解、承認自己都有不懂的東西,大家都不棒,大家的共通點建立在,認清在極速時代每個人都要面對變化與不確定。