作者 車品覺
出版社 天下雜誌
裝訂 單色,平裝14.8*21公分
出版日期 2020/03/04
可扺用 特價商品,不適用折抵服務

【數據化思考套書】數據的商戰策略+大數據的關鍵思考(增訂版)

★ 進入數據驅動的商業世界,「數據思考」是每個工作人的必備能力!
★ 第一手分享阿里巴巴的數據治理經驗,並帶領讀者建構數據化思維

組織裡這麼多數據,為什麼用不出來?數據收集不完怎麼辦?如何找到數據化的切入點?
阿里巴巴前副總裁、數據委員會會長/紅杉資本合夥人──車品覺,
從阿里巴巴經驗,解答企業推行數據化的最容易遭遇的困難點;揭開當前數據變現的最熱領域。

推薦加價購商品

文字字級

套書簡介

 
從行動網路到5G時代,企業欠缺的再也不是數據,
而是一套符合商業目標的大數據策略,實現數據變現。
 
阿里巴巴前副總裁、數據委員會會長/紅杉資本合夥人
車品覺
第一手分享阿里巴巴的數據治理經驗
 
‧數據收集不完怎麼辦?
‧部門各自為政怎麼解?
‧如何找到數據化的切入點?
‧如何不讓安全原則影響業務效率?
 
從阿里巴巴經驗,
解答企業推行數據化的最容易遭遇的困難點;
揭開當前數據變現的最熱領域。
 
本書作者車品覺在2010年至2016年先後任職於支付寶、淘寶,並擔任阿里巴巴集團副總裁及首任數據委員會會長,期間開發多個數據產品,成功帶領阿里巴巴轉型成為數據公司。
 
數據,終將成為企業的核心資產。但是,要落實以數據為核心的改變、讓數據發揮策略性的價值,在實際運作上還有許多環節要打通。在本書中,作者第一手公開阿里巴巴的轉型過程,建立以數據驅動為核心的智慧商業模式,包括如何從工作流中尋找數據化的切入點、如何設定數據收集策略與數據流通策略。
 
並介紹醫療、金融、零售、娛樂等多種產業,如何發揮對數據策略的想像,透過不同領域的數據結合,讓外部數據彌補內部業務的盲點,實現數據變現。
 
你將可以看到:
 
數據營運難題的應對方法──
◤面對資源有限→根據業務需要做數據收集,以短期問題為出發點,以中長期的發展趨勢決定資源分配。
◤面對煙囪林立→採取共創共贏策略,以利益驅動數據流通,當利益高於競爭,數據共享就會變得理所當然。
◤面對數據安全→安全原則要契合企業的商業目標和風險承受能力,才可能獲得內部的支持。
 
豐富的數據變現實例──
◤Lattice Engines利用各種管道公布的資訊,如社群網站的交流、專業文獻的下載、交易會的註冊等,為客戶尋找潛在買家。
◤Credit Karma打破「信用分數」的黑盒子,在使用者的授權下,將信用數據透明化,並發展成個人化的金融服務平臺。
◤Kyruus挖掘醫療領域數據,整合醫生資訊和預約、評價系統,能夠達到有效配對醫生和病人,就我們像預定機票、飯店。
 
 
何英圻│91APP董事長
林之晨│台灣大哥大總經理、AppWorks董事長暨合夥人
許景泰│SmartM世紀智庫執行長
程九如│AppWorks合夥人
詹宏志│網路家庭董事長
鄭緯筌│「寫作力」與「內容駭客」網站創辦人
──一致好評
 
 
 
數據力決定競爭力!
進入數據驅動的商業世界,
「數據思考」是每個工作人的必備能力!
 
阿里巴巴前副總裁、數據委員會會長/紅杉資本合夥人
車品覺
第一本帶領讀者建構數據化思維的著作
 
增訂3萬字全新內容,揭示大數據近未來的6大趨勢與5大觀戰重點
 
‧組織裡這麼多數據,為什麼用不出來?
‧該如何為用戶貼標籤?
‧主管最關心哪三種數據?
 
現在,幾乎所有企業都朝數據企業邁進,
沒有一個商業人士可以不具備基本的數據思維。
 
了解數據的本質以及數據與營運的關係,
更快一步看到機會的路徑。
 
本書作者車品覺在2010年至2016年先後任職於支付寶、淘寶,並擔任阿里巴巴集團副總裁及首任數據委員會會長,期間開發多個數據產品,成功帶領阿里巴巴轉型成為數據公司。
 
在本書中,作者第一手公開阿里巴巴從「數據化營運」到「營運數據」的過程,明確點出用數據、養數據、看數據,這些數據應用的不同階段,分別有哪些實踐重點與容易產生的盲點,學會用數據做判斷,改善業務,發現機會,創造新的商業價值。
 
帶你了解:
◤阿里巴巴的「混、通、曬、存、管、用」6字訣,建立起數據應用的閉環系統。
◤如何從數據的4大分類與5大價值,辨識自己所需要的核心數據。
◤不要只收集自家用戶的數據!跳出既定思維的框架,從相關產業和業務中,收集能夠為現在所用的數據。
◤別再死盯著投資報酬率!了解數據的極限,解讀任何數據指標都必須視情境而定。
 
新增訂數據應用創新實例,包括新創公司FLYR Labs利用大數據預測機票價格,並發展成一門生意;Planalytics將天氣數據轉化為有助零售商、製造商決策的指標;Granify解讀電商網站使用者的「數位肢體語言」,會自動彈出優惠訊息以鼓勵購買。各行各業讀者都更容易將概念應用於自己的產業中。
 
何英圻│91APP董事長
沈南鵬│紅杉資本全球執行合夥人
林之晨│台灣大哥大總經理、AppWorks董事長暨合夥人
林奕彰│eBay大中華區CEO
許景泰│SmartM世紀智庫執行長
程九如│AppWorks合夥人
張建鋒│阿里巴巴技術委員會主席
詹宏志│網路家庭董事長
鄭緯筌│「寫作力」與「內容駭客」網站創辦人
──熱烈推薦

作者簡介

車品覺
數據化思考第一人,未來趨勢觀察家。最早將大數據運營與管理引入電商,豐富的數據實戰經驗,對大數據未來趨勢有著獨到的見解。現為紅杉資本中國基金專家合夥人。
 
生於香港,在英國、澳洲、美國等地接受教育,清華大學經管學院及歐洲工商管理學院(INSEAD)雙碩士。
 
在2010年至2016年,先後任職於支付寶、淘寶,並擔任阿里巴巴集團副總裁及首任數據委員會會長,期間開發多個數據產品,建立全新的數據治理體系,成功帶領阿里巴巴轉型成為數據公司。
 
曾任滙豐銀行IT部高級管理人員、香港電訊PCCW產品經理、微軟搜尋總監、eBay產品總監,以及敦煌網首席產品官,創立世界首家跨境交易的B2B電子商務平台。
 
得獎紀錄:
2014年領導阿里數據團隊獲得Top CIO評選為「中國最佳資訊化團隊」
2017年獲得國家資訊中心評選為「中國十大最具影響力大數據企業家」
2018年獲得中國科技新聞學會「大數據科技傳播領軍人獎」
 
著作:
《大數據的關鍵思考:行動╳多螢╳碎片化時代的商業智慧》
《數據的商戰策略:建立以數據驅動為核心的營運關鍵》

數據的商戰策略試閱

前言 為什麼要認識數據的本質?
 
▍一場以大數據為核心的智慧盛宴
 
時下仿佛大家都在談人工智慧,就像當年人人都在談大數據一樣。
 
大數據時代源自應用所產生的巨量數據,比如微信、淘寶。但是,隨後大數據反過來成為應用創新的核心,這個循環無疑為我們帶來了一種全新的創新型態,那就是──用數據做好產品,用好產品取得更多數據。
 
在不同場合上,阿里巴巴的馬雲、百度的李彥宏及騰訊的馬化騰分別談過自己對人工智慧的看法和觀點。這種對話有點像金庸小說中的華山論劍,到底是氣宗(大數據)還是劍宗(人工智慧)更具策略意義?我認為,兩者是相輔相成的。經歷了互聯網二十年的發展,我們已經積累了足夠的數據去驅動一場「智慧盛宴」,以大數據為核心的人工智慧漸露端倪。
 
2010年,「資料科學家」這個稱謂的發明者帕蒂爾(DJ Patil)和傑夫.哈默巴赫(Jeff Hammerbacher)認為,一切應該以產品為中心,從數據獲取、數據清洗、搭建和管理數據設施、原型開發、產品設計等方面,實踐數據的價值。我在阿里巴巴就經歷了從「數據產品」到「數據作為產品」的階段,後者其實才是大數據的真正產物,也是人工智慧的源泉。
 
▍誰掌握「完美資訊」,誰就擁有整個世界
 
進入數據產業時,我就一直秉承著這樣的理念:在「假設資料都是可獲取的」基礎上思考問題。隨著整個社會數據化程度進一步加深,以及人與物之間的高度互聯,很多以前的數據盲點被快速解開。由不同領域積累的數據所形成的「完美資訊」(perfect information)漸露端倪,這其實是數據從「量變」到「質變」的過程。
 
這個「完美資訊」具有無限潛能,足以讓人工智慧所向披靡,催生各種智慧情境,並讓其如潮湧至。智慧時代,秉承「假設資料都是可獲取的」這一思維方式,才可讓你比別人更勝一籌,從而做到心中有數。
 
在現實中,我們從數據收集、整合、判斷,以至行動、再到回饋的過程並不完美,而形成數據閉環系統的阻力,往往是人為因素居多。
 
Google無人車的偉大之處,正是給了我們重要的啟發,讓我們意識到自動化及智慧化所需要的數據閉環系統是如何做到了既封閉又開放,其中的裡應外合正是未來的發展趨勢。
 
我在阿里巴巴就經歷了四個不同階段:數據驅動決策、數據驅動流程、數據驅動產品、數據驅動業務。在這個過程中你會發現,數據驅動的目標越模糊、數據越零散、人的互動環節越多,智慧專案推動起來就越吃力。
 
▍從數據策略到數據治理,別讓數據成為累贅
 
如前所述,數據資源的積累是發展數位經濟的前提。企業在嚮往智慧時代所帶來的機遇的同時,更要為企業的未來目標制定數據策略。
 
企業不僅要關注自己現在有什麼數據,更要了解未來會欠缺什麼,再去探討欠缺的部分有多少可以靠自己補充,有多少需要求助他人、與他人合作以實現補充。有人把數據比喻為電能,這個比喻很生動,但與電能不一樣的是,數據是可以重複使用的。所以從策略意義上來說,第二使用權的合規性變得非常微妙。
 
大數據背後的邏輯是數據積累越多越好,在過去幾年,很多企業都相信有了大量數據資源後,就能對企業的業務產生更大價值。但人們往往很快就會發現,除了技術能力之外,如何妥當地管理、利用這些資源並非易事,安全合規是一方面,降低數據使用的阻力及風險也是困難重重。所以我一直倡議,數據治理不是數據部門的工作,而是公司總體的策略。這意味著,「本性純善」的大數據也容易變成累贅。
 
▍數據是一種信仰,善用才是本質
 
2016年,一場圍棋大戰讓人類引以為傲的頂尖智力瞬間被AlphaGo踐踏得體無完膚,但在我看來,這場大戰其實不過是一幫人贏了另一幫人。人工智慧在中國稱為人工智能,大部分人僅注意到了「智能」,而忽略了它與「智慧」的差別,「能」是能力的表現,而「慧」是心除雜念,將智慧用在具有普世價值的地方。同樣的科技能力,是被善用還是被濫用,只有一線之差。
 
幾千年來,人類習慣了生存在資訊稀缺的時代,大數據與人工智慧則為人們帶來了曙光,同時也引發了擔憂。暫且撇開我們會不會被機器人侵略這個問題,人類真的已經充分利用自己的潛能了嗎?數據是一種信仰,我們應該善用這個寶藏,為人類創造更美好的世界。
 
我們過去常說:數據不僅是企業與企業之爭,更是國家與國家之爭。但是在不遠的未來,數據驅動的演算法將影響人類生活的各個方面,想在社會中獲得競爭力,我們無可避免地必須成為自己的分析師。
 
 
第2章  數據相關性比數據本身更重要 
 
  • 在資訊爆炸時代,擁有大量資訊可能是災難而不一定是好事,也不等於你有能力使用它。
  • 一切數據收集活動的出發點都來自業務需要,或者可以應對未來的業務發展。
  • 從業務過程中收集資訊、分類資訊、整合資訊,必須成為日常思維的一部分,這是成為數據驅動型公司的必要條件。
  • 數據開發的速度,是營運大數據的必然瓶頸。
  • 一切皆可量化,表面上看似不存在的數據,其實也是有跡可循。
 
假設這樣一個場景:一個愜意的早上,你一覺醒來。吃著早餐,打開電腦,你突然想查一些資訊,但是卻毫無頭緒,因為資訊太龐雜、太碎片化。苦惱之際,你猛然想起自己無意間養成的一個習慣,每當看到一些感興趣的資訊時,無論文章也好,照片也罷,你都沒有讓它變成過眼雲煙,而是花了點時間保存了起來。這時,你的電腦人工智慧掃描了你的資訊庫,透過你平時保存的資訊,分析出你可能感興趣的章節。你打開一看,發現正是你想看的,頓時你心情大好,開始了新的一天……
 
你很驚訝,為什麼電腦可以找到這些資訊?因為電腦的計算是人腦無法比擬的。為什麼電腦能夠幫你尋找目標資訊?因為你早已在無意中習慣性地保存了龐大的資訊,建立了屬於自己的資訊庫。這個有點科幻意味的場景是不是很熟悉呢?作為數據界的「老謀」,我敢肯定地告訴你,這一天必定很快會到來。
 
▋養兵千日,用兵一時──阿里巴巴的數據策略
 
大數據時代衍生的變化,體現在資訊的產生及獲取變得更為快捷,溝通(包括發布、傳播、互動)從單點到互聯,資訊變得更網狀、無序和碎片化。然而,獲取速度又快、數量又多的資訊,很容易被錯誤地解讀為唾手可得,而且成本越來越廉價。如果你目前有這種想法,那你可能已經在不知不覺間被捲進了「數據越多越有用」的誤區。
 
在資訊爆炸時代,擁有大量資訊可能是災難而不一定是好事,也不等於你有能力用好它。暢銷書《大數據》(Big Data)的作者邁爾荀伯格(Viktor Mayer-Schönberger)在最近一次演講上也強調了數據相關性的重要性。簡單地說就是,收集、儲存和管理數據的綜合成本不菲,是每個企業必須面對的問題。
 
根據業務策略而制定的大數據策略變得尤為重要,我們首先需要重新審視或辨識有用資訊,並判斷哪些數據可以放棄。一切數據收集活動的出發點都來自業務需要,或者可以應對未來的業務發展。例如,阿里巴巴的電商數據策略就離不開「人、貨、場」的組合。接下來,就是以短期問題作為出發點,並以中長期的發展趨勢為準來決定資源的優先分配順序。
 
從業務過程中收集資訊、分類資訊、整合資訊,必須成為日常思維的一部分,這是成為數據驅動型公司的必要條件。例如,在產品設計環節中,除了加入產品需求文件(PRD)之外,還要加入數據需求文件(DRD),以重點描述數據相關的需求及變更。
 
以此類推,在業務的各環節中都要考慮數據的收集、匯總及使用,並評估所收集的數據與主體業務之間的相關性。但目前大部分企業依舊秉持「取之所用,無用則棄」的傳統資訊理念,而不會同時考慮長遠數據策略所需要的積累。僅僅服務於當前,為短期目的所收集的數據肯定會偏於狹隘,大數據更需要為未來業務方向做好儲備,換句話說,數據策略的目的就猶如「養兵千日,用兵一時」。
 
明確了業務的長、中、短期目標,以及實現這些目標將會面臨的障礙之後,還得理解數據能力對這些目標有何貢獻。作為策略部署,我們還需要系統思考(Systems Thinking),去發現周邊生態的數據與主體業務之間的關聯。
 
舉個例子,要真正了解淘寶的商品交易細節,除了買家的需求之外,物流、支付、競爭對手、賣方營運等數據,都是整體必不可少的一部分。有了大方向之後,從數據策略到數據落地策略,大致可分為四個步驟: 
 
● 確定業務目標與資訊缺口之間的關係,明確數據收集的方向。 
● 尋找相關資訊的同時,評估零散資訊整合的難度及數據來源的品質。如果數據來自外部,應優先考慮元數據(metadata)較完整的資訊來源。 
● 關注各種數據資源的使用情況及在場景中的回饋結果,同時盡可能記錄下數據從產生到應用的過程,這個過程是從「計畫經濟」到「市場經濟」的落實點,數據必須運用才有價值,以點帶面地經營數據會更穩健。 
● 最後回到第一步,識別資訊來源與業務目標的關係,優化資訊收集、儲存、整合的過程。
 
隨著智慧型物件、人工智慧運用場景的普及,資訊產生的形式和速度也變得難以預測。我們需要更便捷、成本更低的方法尋找及收集多源異構的零散資訊,並把它們縫合起來。所以我一直以來都致力於建立大數據的技術平臺,促進以上各個環節都能更自動化地完成。
 
從我在阿里巴巴管理大數據的第一天開始,我就感受到,數據開發的速度是營運大數據的必然瓶頸。不要小看這個縫合的技術,它是細節上的魔鬼,做好它,才能稱得上真正做好了大數據營運。
 
▋學會系統思考
 
在轟轟烈烈的大數據時代,學會系統思考,有利於擺脫線性局限、小數據時代的思維方式,轉變為人工智慧與大數據亦步亦趨的思維方式,這兩者截然不同。為什麼?我還是那句老話:以偏概全怎麼能和以全概偏相比。
 
什麼是系統?系統是一組相互關聯的主題,在一定時間內,以特定的行為模式相互影響,而且具有自我調整、自我組織及自我演進的能力。當系統受外力觸發時,不同的系統可能會產生不同的結果。一個完整的系統必定由三個點組成:要素(主體)、連接點和目標。當主體與連接點及其功能產生了相對固定的關係時,我們便認為這個系統形成了。
 
以淘寶為例,簡單來說,這個生態系統 (目前流行的名稱是「平臺」)由賣家、買家、物流商、平臺管理方組成,他們之間互相連接,目的是為了匹配需求方與供應方,然後順利地把貨物從賣家送到買家。情況穩定時,各方相安無事,平臺管理方可以坐享其成。當然,這不是系統的真相,在這個系統中,買家與賣家的連接來自交易,更重要的是交易後買家給賣家的評價。根源是平臺為了減少買賣雙方之間的投訴及糾紛,讓評價好的賣家得到更多曝光機會。
 
在這個加強版的回饋機制中,平臺讓買家優先看到的都是誠信得分較高的賣家。沒有足夠生意流量的賣家知道,快速得到大量交易和好評,是爭取曝光機會的重要因素。誠信賣家變得奇貨可居,而好評有價,最終促始一個黑色產業——專業刷評師出現,江湖(系統)從此不再太平。平臺與刷評師之間展開了一場博弈,系統中出現了一個旋渦,真假評價之爭讓平臺管理方左右為難,正因如此,賣家更一度圍攻平臺方,不能刪除被懷疑的假評。
 
以上故事在互聯網時代來臨之前也發生過,只是在互聯網時代,特別是大數據時代,數據更有利於還原真相,大數據也自然成為發現真相的利器。不過,我認為更值得反思的是,如何使用大數據分析去防患於未然,而此時,系統思考就更重要了。 
 
過去,我們習慣在簡單的線性關係中尋找規律,因為我們都假設沒有數據,以及數據稀缺是常態,只能局限於邏輯推敲。這就像螞蟻拚命在二維空間中苦思為什麼無路可走,卻不知道我們其實身處的是三維世界。
 
大數據的存在,就是讓我們把複雜系統變得可描述、可量化、可溯源。隨著科技的發展,物聯網、人工智慧技術的進一步完善,我們越來越不缺少數據,但大家還未意識到萬物互聯之後的世界,系統思考的重要性。

大數據的關鍵思考試閱

新版序 我在阿里巴巴的六年
 
回顧我在阿里巴巴的六年,從經歷來說,是先負責支付寶,繼而負責淘寶,最終負責整個阿里巴巴集團的數據工作。實際上,這個過程同樣也是我對數據應用的一個歷程:第一階段,用數據;第二階段,養數據;第三階段,從看數據到用數據。
 
▋加入支付寶
 
在加入支付寶之前,業界都認可我是一個比較懂得用數據去設計、優化、疊代產品的產品長(CPO)。彼時我在支付寶,大膽地結合產品與數據分析部門,積累了不少經驗。
 
說起加入支付寶,其實有些偶然。當時,支付寶邀請我去分享如何用數據做產品。分享會之後,我去了華星大廈的一個會議室,裡面坐著Lucy(彭蕾,時任支付寶CEO)、Eric(井賢棟,時任螞蟻金融COO)。在那個會議室裡,他們問了我幾個如何能用好數據的問題。當時,我反問了Lucy一個問題:「你每天大概會看多少數據?」
 
「大概幾十個吧。」
 
「不對,你不應該一天看幾十個數據那麼多,我覺得你應該只看幾個數據就夠了。」
 
或許,他們已經不記得我提出的這個問題了,但是我卻記得非常清楚。因為在支付寶的兩年裡,這是我做數據產品時一直遵循的原則。
 
▋堅持數據產品化的理念
 
正式加入支付寶後,我面對的第一件事情,就是著手組建數據分析師團隊。2010年的支付寶,公司大部分業務團隊對數據團隊都不太滿意,而且高層對數據能產生的價值也沒有太多認識。而數據負責人的調職,也導致了支付寶的數據分析和數據技術部門被分開管理。
 
面對數據分析和數據技術團隊的目標不一致,加上業務部門對於為什麼要用數據及如何用好數據充滿疑問,甚至有人認為數據分析僅僅是門面工夫,所以數據技術團隊有時候會跟我的團隊「對著幹」,因為兩個團隊的老闆不是同一人,他們也沒有義務一定要支持我,所以甚至有時候會撇開我們,直接跟業務部門對接。
 
但是最後,我堅持的數據分析產品化路線終於得到了雙方的認同,數據技術團隊甚至還主動過來問我:「我們怎麼合作比較好?」所以那時,雙方的關係就從「對著幹」變成了「我們會全力支持你」。
 
終於有一天,Lucy走進我的辦公室跟我說:「你知道嗎?你們做的產品讓我覺得很爽,我很喜歡這個產品。」而當我在支付寶的第二個產品「地動儀」出來時,她對我說:「這就是我夢寐以求的數據產品。」
 
同事和老闆對結果的支持,讓我肯定自己在支付寶走這條路是對的。如果讓我總結這其中的精髓,我的祕訣就是──數據分析也要講求使用者體驗。
 
簡單來說就是,別說是數據產品,哪怕一份小小的數據報告,我們都必須要知道以下五個問題:
 
  • 這是什麼問題?
  • 這是誰的問題?
  • 這個問題現在必須馬上解決嗎?
  • 這個問題我們能解決嗎?
  • 我們有足夠的數據來解決嗎?
 
▋把報告當成產品來做
 
當我「苛刻」地提出「把月度經營報告當成產品來做,目的是讓這份報告像iPhone一樣好用」的要求時,整個團隊都傻了:報告怎麼能像產品一樣!那麼,為什麼數據報告不能做到行雲流水,讓人看得很爽快呢?
 
所以,我是這麼要求的:首先,報告的前三頁一定要吸引人,讓人有欲望繼續看下去;其次,當別人看到一個數據,心裡在猜測數據背後的各種原因時,我的下一頁報告就要解答他心中的疑問。
 
因此,如果要用產品管理的理念來運行分析團隊的話,必須要問「問題是什麼」,並以此作為切入點。接著,解決用戶的問題,得到用戶的信任,然後就可以做更多的好產品。這是一套做產品的理念,因為產品需要不斷疊代,並非一勞永逸。
 
那麼,我怎麼評估報告是否成功呢?簡單來說,如果一份月度經營報告僅僅五分鐘就被pass掉了,那它肯定是不成功的。
 
我在支付寶,幾乎每次月度報告都會讓管理層討論三、四個小時,一份數據報告居然會成為管理層的討論焦點,每次都有很多高層管理者關注我在講什麼,這時,我就知道自己肯定成功了。
 
當然,我同時也會提醒分析師們,千萬別以為靠一份報告就可以解決所有事情,一定要讓業務部門認為這份業務報告是大家一起探索的,這是我管理團隊的一個基本理念。
 
▋管理團隊、推動理念的祕訣
 
總之,數據產品化的理念最終得到了Lucy及其他高層管理者,以及團隊和同事們的認可。那麼,針對這個理念,我是如何在團隊內一步步推動的呢?
 
首先,我讓團隊做好基礎服務——「白米飯」。為什麼叫白米飯? 因為對人來說,要是飯不夠就會出大問題。對公司來說,如果數據基礎服務滿足不了使用者,他們就會跳起來,那時候再高大上的報告也沒用。所以,我要求分析團隊一定要跟業務部門達成共識,知道什麼東西如果我們不提供給他們,結果會很嚴重。
 
但是,長期做「白米飯」的分析部門是沒有前途的,所以其次,我抽出團隊一部分人成立了「突擊隊」。每當我聽到管理層對數據的需求時,就把資訊帶到團隊,讓團隊成立兩、三支「突擊隊」,讓管理層用到有用的、合適的,以及帶有探索性的內容。把自己最精銳的部隊放在「突擊隊」裡,這個決定非常重要。
 
值得注意的是,成立「突擊隊」有一個前提,那就是必須要有人能接觸到最高管理層的資訊通道,否則無法得到高層的資訊。而這個角色就是我,我接觸最高管理團隊,並且把資訊輸送給「突擊隊」。
 
以「白米飯」和「突擊隊」為基礎,最後一步,我們開始沉澱數據分析的框架。為什麼數據分析框架如此重要?因為它是數據產品的養分。我用建立數據產品為目標的理念來經營數據團隊,而數據分析框架,才是給數據產品養分的關鍵點。
 
在支付寶時,基於Lucy和Eric對我的支持,數據產品都是自上而下推行。我先做了「觀星台」,這是一個給高階管理者的數據儀表板工具,然後做了「地動儀」,一個給中階管理者的數據產品,接著還有「客服360」等。
 
所有這些數據產品,都是從數據分析框中提煉出來的。把分析的理念和框架,變成數據產品,本質上是數據一般化的過程。這個過程非常重要,因為數據報告的需求會越來越多,如果不這麼做,分析團隊將永遠被冗雜和重複的工作所困。
 
▋不讓當前的技術,限制未來的產品
 
在這期間,我們也做過一個改變。因為「觀星台」和「地動儀」還是傳統的分析工具,只不過讓你有更好的「眼睛」,看到更好的數據。用我一直強調的理念來講,這屬於描述性的報告,用於描述一家公司今天做得怎麼樣。但由於我們有了分析框架,可能稍微會帶一點診斷性。所以,這種產品主要還是描述性產品,偶爾會做一些診斷,但還未達到探索預測的狀態。
 
在這個看法的基礎上,我有了個新想法,想法的靈感源於Facebook。當時Facebook已經積極發展探索性的數據產品,視覺化及交互功能已經非常靈活。探索和靜態報告的區別在於,使用者可以選擇自己的角度靈活地看數據,真正做到「逛」數據。
 
因此,我們創造了一個產品叫「黃金策」,可以讓使用者很輕鬆地在三秒鐘內,就看到在不同標籤下用戶購物行為的異同。比如,30~35歲的上海女性,擁有一張信用卡和多張信用卡的兩個不同群體,看她們的購買行為有什麼不一樣;或者,看廣東和上海的女性在購物表現上有什麼不一樣。使用者可以非常輕鬆地比較不同用戶群的購物表現,所以我認為,好的數據產品應該是可以激發使用者靈感的。
 
在做「黃金策」這個產品的過程中,讓我深有感觸的是,數據產業的人,很容易讓技術制約產品的發展。當我提出做「黃金策」時,大部分技術工程師都斷言,三秒鐘就要有結果是不可能的。因為以前類似的靈活配置的報告,一般都不能做到即時查詢,如果要快速產出的話,只能找分析師。即便如此,也可能因為資源排期等原因等待很久。
 
當時只有一個人站出來說「我可以幫你搞定三秒鐘」,這個人就是蔣傑(現任騰訊數據中心總經理)。於是很自然地,我就跟蔣傑一起合作了這個專案,並且成了好朋友。後來,蔣傑很出色地幫我完成了這個專案。所以我覺得,做技術的人,不應該讓當前的技術和思維,限制未來的產品。
 
就使用者體驗來說,使用者之所以不使用我們的產品,其中一個很重要的原因是,沒有人願意耗時太久等一份報告。因為當報告出來之後,他的問題可能早已經解決了。試想,在做決定時,拍一下腦袋只需兩分鐘,但等一份報告要兩個星期,而且報告的結果還不一定能幫上他,你說,他會選拍腦袋還是等報告?所以,這也是我們產品人的理念:到底怎樣才能解決使用者的問題?而這也是產品人和數據人不一樣的地方。
 
▋淘寶的挑戰
 
有一天,Lucy把我叫過去說:「現在淘寶很需要你,淘寶的數據體系需要你去整理。」那是2012年底,也是我在支付寶的黃金時代,就這樣,我來到了淘寶,開始了我在阿里巴巴後四年的時期。
 
淘寶前兩年的經歷非常豐富,每每回想起來都像過去了十年,我的白髮基本上也都是在這段時間長出來的。
 
從支付寶來到淘寶,意味著我要重新打一仗。由於我已經在支付寶打了一場勝仗,所以可以照搬很多頂層設計到淘寶使用,但我也不能完全照搬,因為淘寶使用的頂層設計有些跟支付寶一樣,有些卻完全不一樣。
 
淘寶跟支付寶相比其實要複雜得多。淘寶本身是個自下而上的組織,是個極其複雜的生態圈。有趣的是,當我來到淘寶時,面對的情況恍如回到了入職支付寶時的情形:團隊的人差不多都走光了,我感覺就像踏上了一塊杳無人煙的新大陸——分析師只剩下幾個人,而且我被告知這幾個人還會陸續離開。
 
面對這一切,我做了一個今天回想起來仍然覺得很勇敢的決定:我說我不會帶支付寶的一兵一卒過來。所以說,我在支付寶組建了一個完整的團隊,然後在淘寶又重新組建了一支全新的團隊。這段經歷其實讓我很痛苦,但也是極為珍貴的人生經歷。
 
當時,淘寶的數據技術團隊很亂,而且是累積多年的亂,所以,要整理淘寶的數據體系,只用頂層設計和數據產品的方法做,肯定是行不通的。
 
當我發現自上而下的方法不行之後,我就逐步去做更多能發現問題的數據產品。總體來說,還是堅持數據一般化的方向。在淘寶這樣自下而上的組織,這相對來說比較容易,因為權力已經下放給每個小二(工作人員),在需要數據幫他們做決策時,讓他們每個人都用數據產品,比在支付寶時期其實更容易。反而因為數據非常零散,要做好一個數據產品,知道如何化繁為簡更重要。因為雖然有資源,但使用資源的人也很多。
 
值得一提的是,我們當時做了一個非常重要的決定,就是行動終端。那時候,很多淘寶的消費者都開始使用智慧型手機,我就決定,我們一定要做行動版的阿里數據App。「淘數據」這個電腦版產品在我來淘寶之前就已經存在,只是一直不溫不火,不是沒人使用,而是產品的使用者體驗不好。因此,當我們用行動版取代電腦版之後,發現很多高階管理者及中階管理者一下子變成了午夜常客,我就知道自己的決定是對的。
 
此外還有一件事,那就是數據服務,當時需求也已經顯現出來。因為我們這個部門承擔的責任不僅是數據分析,還有數據底層的搭建。雖然我的業務分析團隊當時只服務淘寶,但是數據技術團隊要服務天貓、淘寶、聚划算等多個業務部門。這需要我們在數據服務上分幾個層面去做:一是除了淘寶之外,天貓、聚划算事業部的數據產品,我們也幫他們做了;二是我只建數據中間層,別的部門可以用我們的數據中間層來建他們的數據產品;三是提供數據服務,我用早期的數據服務方式把數據輸出給其他部門使用。這就是我在淘寶前期的情況,上半身(分析師)是淘寶,下半身(數據底層)是集團。
 
▋啟動阿里巴巴大數據
 
進入阿里集團的這幾年裡,大部分業務部門的分析師都歸我管理,同時,數據平台和技術底層也都在我這邊,所以我的業務就演變成了集團數據技術及產品部,內部叫DT(Data Technology)。
 
回想淘寶時期,我一直覺得,如果我能早點整合數據底層團隊,收穫會更大。整合數據要花的力氣往往跟數據的離散、不規範、各自為政很有關係。有時,白紙一張重新開始,比起消耗大量時間在處理老問題要簡單得多。
 
而對於我們整個DT部門,這時候有兩個新的使命:一是做對外的數據產品,即生意參謀,同時也逐步把集團中其他對外數據產品,例如「數據魔方」及「量子報告」等,綜合到生意參謀上;二是建立數據公共層,這是結合集團各業務群的共用資源而成的數據服務,希望可以成為內部的DaaS(Data as a Service,數據即服務)模型。
 
數據公共層的起緣,是因為當時集團各個部門建了很多自己的數據「煙囪」,重複建設嚴重,導致數據的存儲、加工等資源嚴重浪費。怎麼把各個「煙囪」中的數據分為專有和公有,並且把公有的數據放在數據公共層,這是我在這段時間內耗費精力最多的事情。在我眼裡,這個數據公共層也是我認為在大數據中最重要的東西,我也在其中學到了很多經驗。
 
前面提到的那些應用,我們都可以稱之為「數據」,而這時才是「大數據」。「大數據」的意義就在連結,數據公共層就是跨業務群的精華,讓所有人都能利用其他人的數據冗餘,這時,「大數據」才算做了起來。
 
我這麼說,不是說我們以前沒有數據共用,而是從前都是零散和沒有計畫地分享及同步數據,有點小打小鬧。到了正式建立數據公共層的時候,才有人去整合全集團的所有數據,把它當成一個數據資產共建來看待。所以,數據公共層後來就被CEO定義為公司唯一的數據資產收集與加工部門。
 
▋打通數據循環
 
在淘寶的幾年生涯裡,有個非常重要的專案讓我永遠難忘。
 
有一年,馬雲要我們把聚划算自動化,在我眼裡,其實這就等同於商業版的無人駕駛技術,因為,要把這個部門的品類規畫、選品、定價等流程自動化,讓機器決定什麼產品哪天上架。它要求整個過程中的決策都要自動化,而沒有人參與其中,這對我們數據的收集、加工、提煉等整個鏈條的能力都提出了非常大的考驗。
 
而且,這個專案也是真正實驗如何在業務營運中,使數據技術成為主幹的一步。數據能力、演算法,要完全融入業務流程當中,每個環節中的數據回流等,都將成為循環的一部分。
 
好在,這時我們部門已經是一個具備全方位能力,能夠覆蓋數據的準備、加工、收集、分析、整合到使用整個鏈條的部門了,而且我的數據科學團隊也開始參與集團中很多不同業務的專案,甚至連交通這樣的政府專案都有涵蓋。
 
對於這段時間的經歷,我想說,我很榮幸,能夠用我的白髮換來親身經歷一場人機大戰的故事,讓我可以在過去三年中接觸到這麼多數據,甚至整個數據鏈,最終我實現了數據應用的循環。要做好數據,我們首先要在數據使用的循環中,讓數據越來越容易使用,同時在數據準備的循環中,讓製作數據的成本越來越低。
 
在這個循環系統中,虛線以上,使用者能很簡單地使用,虛線以下,是讓數據製作變得更快、更自動化。如何讓多種、多樣、多變的數據原料,可以快速、靈活地重組,並且相對穩定,使數據產生價值,這是做數據基礎建設天天都要去想的問題。
 
這就是「存、管、用」和「混、通、曬」。「存、管、用」就是用技術而不是人工方法,去做資產或原料管理。怎樣評估是不是做得好呢?得看數據有沒有、細不細、全不全、穩不穩、快不快。所以,一旦把數據管理好了,我們就會很快、很靈活地做出數據,並且在使用的時候產生很大的價值,到底我們提煉到的會是垃圾還是黃金,就取決於此。
 
以往,用數據要「混、通、曬」,養數據要「存、管、用」,經歷了支付寶和阿里集團的六年後,我覺得以上每一個環節都已經出現很多創新,比如,感知技術的創新,讓數據收集層面多姿多彩;存儲的格式會更適合數據的靈活調動;人工智慧除了直接服務於產品外,還可以增加數據的識別度;大家都已經意識到,數據的互聯互通及品質保證,是數據科技的基礎。
 
▋我看數據科學
 
在2010年底,我就意識到大數據的出現,所以當時就跟Lucy提出,支付寶要有一些數據科學的人才儲備。但可惜的是,我雖然感覺到了新時代即將來臨,卻未能正確地指出機器學習的趨勢,所以沒有大力引進。
 
而到了淘寶後,我是第一個在管理層力推大量招聘數據科學家的人,當時還有其他高層質疑我的做法。但在當時淘寶總裁的大力支持下,我終於如願。記得我招到第一位數據科學家後,我們每週都會在我的辦公室約談,用非技術語言聊數據科學家是做什麼的,以便很快地加深我對數據科學的理解。
 
傳統的數據科學家常常是博士或博士後,研究的方向是機器學習。數據科學家的出現,其實是個演變的過程,幾年前,企業的數據應用都是看得多、用得少,不夠直接,也很少涉及機器學習、演算法等領域。
 
從數據科學家加入的那天開始,我就認為他們是不可或缺的,他們的工作不是今天的數據分析師和數據挖掘工程師做得了的。雖然數據分析團隊中也有數據挖掘的人,但數據科學和數據挖掘是有區別的。
 
我認為,合格的數據科學家應該具備產品意識,為了解決問題,會更偏重於找到問題的原因,然後找出最好的方法來解決它。所以可以說,區別就在「科學」這兩個字。
 
數據科學是科學,不是工程。工程追求效率,科學追求真理。如果數據科學家做得太過實作,就會變成數據挖掘工程師;如果他「飄」在空中,將無法在企業中生存。企業想要找到既能上天,也能落地的數據科學家很難。在我眼裡,一個企業如果有這樣的人,就像三國時期劉備有了關羽。但可惜的是,這世上關羽少之又少。
 
在這種情況下,企業應該把事情分為長、中、短線來看。頂層設計要清楚,讓數據科學家做一些比較有難度的事情,讓能落地打仗的工程師去做落地的事情。這兩者如果沒有好好區分,他們之間就會「打架」,這樣企業耗不起。此外,從企業環境來說,一家公司到底有沒有科學精神,也會非常影響數據科學人才的落地。
 
經歷過對數據科學的理解後,回想我在支付寶做的最後一個產品「黃金策」,如果今天讓我重新做這個產品,我不會用以前的方法,因為今天的技術和過去的技術已經不一樣了。
 
「黃金策」給人的感覺是可以發現很多東西,但同時,能發現的東西也是有局限的。雖然有六百個或八百個用戶變量讓你自己組合,但數量還是只有這樣,能不能有六千個或八千個呢?從今天的技術來講,用深度學習的方法,有些環節機器會做得比人更好。
 
六年來,我所做的工作都是從人的經驗提出一個假設,然後用數據來證明哪個假設更有可能。到今天為止,由數據來告訴我們新的發現,還是少數情況。但數據帶來的這些少數新發現,是人類以前的邏輯中所沒有的。換句話說,數據重組了這個世界的「可能」。
 
這是人類為什麼要花很多資源去做大數據的原因所在,因為人類的思考是有局限的,但運用集體智慧,用深度學習的方法來找出人類提不出來的假設,然後透過人機協作,找出未來的新世界、新智慧,這就是數據科學要走的路。
 
數據科學如果不是每天都在進步,每天都不滿於今天的狀態,去PK以前的理論,就不是數據科學,而是死工程。
 
數據科學每天都在突破以前的理論,因為以前的理論只能解決某個點,以前的頂層設計只適合以前的情況,未來的頂層設計怎麼樣,需要我們不斷去探索,而科學,就是探索。


TOP
販售中
會員價 $600
定價 $800
您會有興趣的書刊
網友看過此商品後買了