為了迎接即將到來的大數據時代,各大互聯網公司都在爭分奪秒。阿里巴巴在公佈大數據分享平台之後的半年中,也全面啟動了攻勢。但即使是這個行業的先行者,離大數據時代也還有不小的距離。
剛剛過去的2012年,秦予有個很大的遺憾,就是沒能招聘到自己想要的數據科學家,浪費了公司給的招人名額。他是支付寶用戶價值創新中心的負責人。這個中心是支付寶大數據業務的核心部門。
阿里巴巴2012年的進人指標只有200個,具體到支付寶公司,基本是只出不進,只有秦予所在的部門得到了難得的兩個進人名額。但她只招到了一個合適的。
事實上,各大互聯網公司都在尋找這樣的人。騰訊網絡媒體事業群總裁劉勝義2012年年中就公開表示:隨著用戶各類數據的累積,大數據時代已經來臨。騰訊各大產品線中都擁有自己的數據挖掘團隊。而騰訊最新財報顯示,QQ用戶數接近8億人,活躍用戶數近2億人。
阿里集團2012年7月10日就已宣佈,設立首席數據官崗位(CDO),負責推進「數據分享平台」戰略。同日,阿里發佈「聚石塔」平台,為天貓、淘寶平台上的電商及電商服務商等提供數據云服務。
阿里巴巴集團表示,如何挖掘、分析和運用這些數據,並和全社會分享,是這個戰略的核心所在。阿里巴巴是年交易額過萬億元的中國最大的電子商務平台,目前有兩萬人左右,其中近千人從事數據業務工作。
可以看到,從數據中掘金,已經成為各大互聯網公司的共識。但在這個即將到來的大數據時代,這些公司具體將如何推進呢?
「離大數據時代 還有不小距離」
秦予要找的並不是一般的數據分析師。
「國內不缺數據挖掘人才,但很難找到數據科學家。」秦予對南方週末記者說,秦予的團隊有7個人,他們在支付寶內部被稱為「數據科學家」。
一般的數據分析師是根據支付寶的各種數據進行分析,給公司決策層和各個業務部門提供諮詢支持。這也是目前很多公司都設有的商業智能部的主要職能。但數據科學家們做的事情是開發出具體可以銷售的商用化的大數據產品。
所謂大數據,一般是1000T以上的數據,如果按照一般機器配置,相當於400台到500台電腦。對這些數據信息的商業化開發就是大數據產業鏈。
《大數據時代》一書中提到,未來,數據將會像土地、石油和資本一樣,成為經濟運行中的根本性資源。數據科學家被認為是下一個十年最熱門的職業。
而大數據跟個人最為密切的關係是對隱私的可能侵入。比如,亞馬遜監視著我們的購物習慣,谷歌監視著我們的網頁瀏覽習慣,微博似乎對我們和我們朋友的關係無所不知,QQ圈子能給你推薦你不願意再見面的某個女生的照片和動態信息。
秦予是從美國歸國的計算機模擬博士後,在摩根大通和匯豐銀行工作過多年,2010年加入支付寶公司,負責支付寶和淘寶集市的大數據業務。支付寶公司擁有中國僅次於銀行業的個人數據信息。
「阿里巴巴有海量的數據,對於做大數據的人來說,阿里巴巴是中國最好的平台,很吸引人。因為我的金融背景所以選擇支付寶。」秦予對南方週末記者說。
回國進入大數據行業之後,秦予參加了很多大數據的論壇和研討會,她最大的體會是,看到的新東西很少。
「別說大數據,連小數據都很少。現在很多公司說的大數據,大都是數據的蒐集和整理。這是底層的工作。」秦予說,「中國離大數據時代還有不小距離。」
即使是作為國內大數據業務的先行者阿里巴巴,其大數據業務發展也依然是分散在各個子公司,並在2012年下半年才開始推出少量的商用產品。
「從人出發,先去找人」
支付寶曾經在八年前公司成立第二天就建立了數據部門,但真正有大數據業務,是在2010年的事情。正是那時候,支付寶從招商銀行信用卡中心招來一批專業的金融人才。秦予也是那時候加入支付寶的。
「金融行業的大數據業務已經很成熟了。」秦予說。
支付寶的數據科學家每天做的工作就是,把客戶分成50個族群進行研究。比如,細分出都市輕熟男群體,這個群體的特徵是每次買的不貴,均價七八十元,收入中等,但很喜歡在網上買東西。
還有一個族群被稱作「千金美少女」,其特徵是收入並不高,但家裡有錢,買得多,買得貴。
按照分群研究的思路,秦予的團隊把淘寶、天貓、支付寶和聚划算的用戶做系統研究,通過觀察他們喜歡看什麼媒體,上什麼網,來「生動地」知道用戶是個怎樣的人,進而推薦商品供用戶購買。
能識別用戶之後,在寫商品推薦文字的時候,不再是過去那樣千篇一律地使用「親」作為開頭。
「今天很多網站犯的錯誤就是,根據個人購買記錄,推薦一個類似的產品。其實用戶很可能買過了。用戶要的是你給他推薦一個跟他相似的人買的東西。」秦予對南方週末記者說,以前的數據研究思路是從產品出發,大數據時代是從人出發,先去找人。
支付寶發展大數據業務,目前主要是為內部服務。比如,過去支付寶很重視新客戶的獲取,但後來發現開賬戶的人多,關賬戶的人也不少,通過數據分析,支付寶建立了一個流失預警模型,預測每一個人未來三個月是否會離開支付寶,並對潛在的流失用戶做一些喚醒。
「支付寶是准金融行業,數據比較敏感,涉及用戶隱私,還沒有到開放的階段。」秦予對南方週末記者說,支付寶非常忌諱提供商用化產品給商戶,很多合作方惦記著的是支付寶的數據,但這是支付寶的高壓線。
「支付寶發展大數據的目的,跟淘寶和天貓有點偏差。我們更多地是為內部服務,淘寶和天貓更多地強調商業化。」秦予對南方週末記者說,阿里巴巴集團的大數據業務商用主要是淘寶平台的幾個公司在推進。
「數據分享平台」戰略
淘寶平台的數據大概可以分成三塊,一是離線的數據,比如什麼地方的人最愛吃大閘蟹。另外一些在線數據,主要是圖片,淘寶一些大的賣家都把圖片存在淘寶裡面。還有一些信息是用戶的淘寶收藏夾。
2010年3月,淘寶宣佈將面向全球首度開放數據,並制定了兩條大原則:數據分層次開放;涉及消費者個人或者企業隱私的數據絕對保護。
淘寶的數據開放一是對公眾的免費信息,比如推出類似於宏觀經濟數據的「淘寶指數」。商家可以根據以往的銷售信息和「淘寶指數」進行生產、庫存決策。對於大眾來說,淘寶的數據發佈就像是統計局和價格監測機構的功能,淘寶指數相當於行業和宏觀經濟的各項指標。
作為針對企業的數據開放的商用產品,淘寶推出了數據魔方產品,通過淘寶數據魔方平台,商家可以直接通過數據魔方產品獲取行業宏觀情況、自己品牌的市場狀況、消費者行為情況等,但是不能獲得競爭對手的數據。
2011年4月,數據魔方正式上線。在「店小二」的推廣下,林氏木業成為第一批使用者。林氏木業是一家完全依靠互聯網平台銷售家具的電商公司。
該公司一位市場推廣人員對南方週末記者介紹了數據魔方的具體運用過程:依據數據魔方關於熱詞的各項數據變化,及時調整優化商品標題,提高寶貝排名,進而獲取更多流量,提高銷量。
以銷售面膜為主的素野天貓旗艦店的運營經理陳林告訴南方週末記者,素野選擇數據魔方專業版本,支付3600元/年的費用,除魔方外,還可以使用量子恆道(淘寶官方推出的一款免費數據分析工具)。
「數據魔方帶來的更多是虛的概念,對流量、銷售額這種具體指標意義不大。」陳林說。
2011年6月,淘寶一分為三,變成天貓、淘寶集市和一淘網。這之後,淘寶系的大數據發展的主要任務放到了商家已經形成了付費習慣的天貓平台。目前天貓的主打大數據商用產品是聚石塔。
2012年7月,阿里巴巴集團的「聚石塔」正式發佈,「數據分享平台」戰略全面展開。聚石塔是阿里巴巴首次聯合全集團大數據力量打造的一款大數據商用產品。其中,天貓及淘寶網主要負責尋找合作夥伴,發展商家,阿里云負責提供云主機,萬網負責客戶服務。
同時,阿里巴巴B2B公司CEO陸兆禧出任集團首席數據官崗位,向CEO馬云直接匯報。馬云在聚石塔發佈的時候宣佈了阿里集團未來新戰略:平台、金融、數據。
聚石塔提供數據存儲、數據計算兩類服務。根據官網上的指導價格,若需要內存為1200M、50G容量的數據存儲服務,優惠價為6090元/年;如果購買英特爾雙核處理器、內存4G、硬盤500G、帶寬5M的彈性託管服務,價格約在7700元/年。
廣州衣酷服飾有限公司的運營總監敬小虎對南方週末記者表示,他們公司是2012年9月開始使用聚石塔服務的,正好趕上「雙十一」大促銷,兩天之內發完了所有的貨,總共3萬多票。他負責該公司在天貓上的店舖皓盾天貓旗艦店的運營。
「沒有這個軟件,半個月都發不完這些貨。」敬小虎對南方週末記者說,如果按照2011年沒有加入聚石塔時候的「雙十一」銷售情況,光把訂單人工下載下來就花費了三五天時間。而且還出現過很多漏單和重複下載問題。
不過,敬小虎表示,如果店舖一天的銷量能做到500票以上,購買聚石塔服務比較划算,否則軟件買下來除了應對「雙十一」這樣的大促銷,基本就閒置著。
平台後的產業鏈
阿里巴巴公佈的信息顯示,自2012年7月10日聚石塔發佈以來,已有十多萬的商家入駐。聚石塔的訂單覆蓋率,10月中旬的數字是20%。
2012年「雙十一」購物狂歡節,是對天貓大數據發展的一次檢驗。據天貓官方數據顯示,狂歡節大促當天,聚石塔內系統處理的訂單超過天貓總量的20%,比平時增長20倍。
又一城公司是首批進入聚石塔服務器項目的軟件IT企業。又一城公司的銷售人員賴活龍對南方週末記者表示,有ERP系統的商家可以直接找天貓,沒有ERP系統的商家,只能找像又一城這樣跟天貓有合作的軟件商,讓軟件商幫忙接入聚石塔服務。
又一城和阿里巴巴的合作模式是,又一城基於聚石塔開發的軟件,對接淘寶和天貓等阿里系公司的後台系統,包括訂單信息、商品信息、會員信息、財務信息、物流信息和庫存信息。
賴活龍對南方週末記者透露,最近半年,他的重點一直是推銷聚石塔產品,一開始很多商家聽到是推銷軟件產品的電話就會按掉電話,現在的情況好多了,不少商家主動打電話來瞭解情況。
「這跟天貓的宣傳很有關係,另外就是雙十一檢驗了產品的價值。」賴活龍說。
賴活龍也承認,商家加入聚石塔之後,最直觀的改變是訂單處理的效率提高了,以前從淘寶平台下載訂單,一分鐘能下載200單,現在至少2000單。但銷售額並沒有太大改變。
越來越多的商家被迫參與到大數據產品的購買中來。
因為促銷活動越來越多,參加的話,IT系統往往跟不上,造成錯單配送等問題,中差評接踵而至,動態評分直線下降,銷量跟著下降,所以只能是購買聚石塔服務。不參加的話,沒有流量,沒有銷售額。
「如果商家不跟著淘寶走,就會受到冷落,你進來了,碰到雙十一這樣的活動,天貓會看你是否加入了聚石塔,如果沒有加入,你報名的資質能否通過是個大問題。」賴活龍說。