文/成遠
年輕的數據分析師Neo正在北京郊區的一間四面是墻的會議室面對著一大堆銷售數據,他的工作是對它們進行檢索、排序、過濾和分類,并希望能在其中找到一些趨勢,從而能夠給客戶提供一些尚未引起重視的角度。
“在一張正方形的圖紙上,橫軸代表對不同產品利潤率的預期,縱軸代表每一次銷售的實際利潤率,然后一個點代表一次銷售──如果是銷售了產品A,那么就在橫軸上找到對產品A利潤率的預期,縱軸上找到該銷售實際的利潤率──這張圖的對角線就是銷售利潤率滿足預期利潤率的分水嶺。這樣的數據表現方式展現了許多被人忽視的趨勢,比如同一產品竟然會有如此的利潤率差異,一些產品的利潤率預期根本高得離譜,以及不同渠道帶來的顯著的利潤率差異……”
很多人已經開始被Neo的這張圖表搞暈了,不過很快又明白過來,興致勃勃地和他討論起數據背后的生意經來。Neo時常會想,在中國這樣一個重視關系和人情的文化中,數據到底能發揮多大的作用?Neo希望有朝一日能借助互聯網這個大數據庫將數據分析應用到更廣泛的商業活動當中。
當Neo正在為自己的這些想法興奮時,他所期待的未來其實正在發生……
言情片影迷和汽車租賃公司
“言情片影迷和阿姆斯特丹汽車租賃公司有什么關系?”
《The Numerati》(中文譯名《當我們變成一堆數字》)一書的作者斯蒂芬·貝克(Stephen Baker)向他的采訪對象——Tacoda公司的創始人摩根問道。問題的由來是Tacoda在檢測阿姆斯特丹汽車租賃公司的網絡橫幅廣告的點擊用戶時發現,排位第二大廣告受眾來自言情電影的網站。兩者之間的關系令人費解,但事實就是在言情片網站展示阿姆斯特丹汽車租賃公司的橫幅展示廣告效果非常好。
幾個月之后,Tacoda公司以2.75億美元的價格并入美國在線,當斯蒂芬再次見到摩根時,后者說終于找到了那個令人費解的問題的答案:周末。于是阿姆斯特丹汽車租賃公司的廣告部制定了“周末大逃亡”的休閑營銷方案,吸引來了眾多網民的眼球。言情片影迷租賃汽車大多是為了周末的休閑旅游。
上述情況給數字科學家們帶來了新的挑戰,他們不僅要描述網絡用戶的品位和嗜好,而且要洞悉人類不斷變化的心情。
當我們在互聯網上點擊一首哀傷的歌曲或者一部言情電影的視頻時,是否不經意間透露了我們當時的心情?我們快樂嗎?我們在沉思什么?這是一片富含人類行為數據的尚未開墾的沃土和金礦。不管你是否愿意,技術的普及會讓這種未來逐漸變為現實。隨著越來越豐富和完整的數據被收集和保留,人類透過互聯網點擊留下的愉快、哀傷和靈感將被更準確的記錄和理解。
事實上,數字科學家已經滲透到日常生活的每個領域,他們將我們描繪為工薪族、購物者、選民、博主、潛藏的恐怖分子、病患者,甚至是戀人。他們在公司洞察我們的電子郵件和電話記錄,來推測有多少員工真正在為公司的盈利添磚加瓦。他們分析我們的購買行為,以搞清我們是在節衣縮食、瘦身,還是有新的理財計劃。從保險公司到奧巴馬競選團隊,他們雇傭大量Neo或者比Neo更資深的數字分析專家,從一大堆數字符碼中過濾出寶貴的趨勢和觀點。在數據爆炸的世界里,懂得利用數據、運用數學的權威們的地位正在躥升。
那些互聯網上的數據權威
互聯網正在成為一個巨大的數據庫和營銷平臺。正如Neo分析過那些銷售數據后所想到的,面對尚未開墾的數據金礦,我們既缺少足夠大量的原數據,也缺少挖掘、分析數據的模型。
幾乎沒有人不知道Google,其實它的開始僅僅是因為找到了一個理解網頁鏈接數據的模型。可能未必很多人都知道另一家叫comScore的公司,它負責采集更基礎的網絡數據,它的地位確立卻和Google有關。這家2007年在納斯達克上市的第三方互聯網流量跟蹤測評機構,曾在2008年年初的一份報告中指出,Google在美國市場獲得的付費點擊次數增長放緩。comScore這一報告對Google股價隨后的大幅下跌起到重要的推動作用。
盡管后來Google憑借海外市場的業績增長令其股價回升,證明分析師對comScore給出的美國市場數據的解讀是片面的,但comScore在互聯網媒體中權威測評機構的地位得以確立,與其并列的是電視行業的AC尼爾森,廣播行業的Arbitron。互聯網廣告網絡公司Federated Media創始人約翰·巴特利(John Battelle)甚至說:“當寶潔對你說,除非你擁有漂亮的comScore數據,否則不會在你的網站上投放廣告,那么你就會問,‘我如何才能提高自己的comScore數據’?”這使得comScore成為網絡廣告大戰中的裁判,而這一市場的價值已高達250億美元。
在上海張江孵化中心,也有一家要成為中國的comScore的公司——訊實網絡。公司創始人于輝發現,和美國互聯網市場明顯不同,在中國,網吧上網用戶的行為數據是解讀中國互聯網市場變化的重要指標;同時,和歐美用戶主要通過瀏覽器訪問網頁來實現網絡生活不同,客戶端軟件明顯地切走了中國互聯網一大塊流量。近兩年的數據還顯示,單個用戶通過客戶端上網的時間呈集中化的趨勢,比如80%的時間是游戲或者看視頻。這種現象帶來的商業影響可以舉個例子,比如有的用戶常年依賴淘寶,上網幾乎就是上淘寶,他甚至會從淘寶買一本書,而不會去考慮,其實卓越或當當的同樣一本書更便宜,更不可思議的是,淘寶賣書的店主很多時候就是從卓越和當當進書。
訊實網絡現在每天記錄60GB的數據,很快就會增長到100GB,面對越來越多的數據,于輝有時候會有和Tacoda的摩根類似的困惑,比如一些汽車廣告的點擊來自一些英語學習網站的用戶,于輝的解釋是,也許他們學英語是為了出國,出國就有可能需要租車、學車或者買車,這種理解的價值就在于,于輝可以告訴汽車廣告主應該把廣告放到英語學習網站上。而上面提到的阿姆斯特丹汽車租賃公司的廣告的受眾中,比言情片影迷更多的第一大點擊人群竟然是那些訪問過在線死亡名單的用戶,對于這些離奇的關聯性,摩根至今沒能找到明確的答案。但每當想起還有如此多問題需要回答,這些數字專家們的臉上就會泛起孩童般的微笑。