新浪財經訊 2014亞布力中國企業家論壇夏季高峰會,于8月22日-24日在河南鄭州召開。在中國經濟已由高增長轉為中低速增長的大背景下,我們需要一種新的“增長觀”,為經濟轉型、深化改革贏取時間。本屆夏峰會的主題為可持續增長的動力。
在大數據時代——從概念到實踐分論壇中,當當網[微博]董事長俞渝表示,我們不賣數據,和這個數據是當當的核心能力兩者的關系。首先它是核心資產,這個核心資產我們涉及的是幾千萬顧客,十幾年的購買。真正去處理這些數據能力的人,除了我們自己別人除了不好,就是把生的數據,哪怕把張三李四都隱藏,給奶粉公司還是給房地產公司,他也抓取和使用不好,這個東西是很關鍵的。
以下為大數據時代——從概念到實踐分論壇實錄(部分):
俞渝:我覺得有些公司從一開始就是以數據為生的,我認為電子商務行業就是這樣。因為電子商務沒有實體,然后做電商的公司,無論是準備商品還是他找到目標客戶,他所有全部都是數據。我覺得在2004年、2005年早期做當當的時候跟今天不一樣,我們那時候用一個詞叫數據挖掘。然后過了幾年那個詞改了,就是要根據挖掘出來的數據建立一些模型和倉庫,還有數據的遷移,大數據什么時候熱門的我沒有特別注意過。
我覺得以當當或者個案,或者是我們這個行業來講,數據的應用我想是分幾個層面的。一個是在銷售層面上,我們可能要推出,比如說還看了什么,還買了什么,還瀏覽了什么,他的歷史,和你相像的人,他在關注什么,這個數據是毫秒性的。以前計算成本比較昂貴的時候我們可能是幾天更新一次數據,后來變成當天更新數據,現在計算能力沒有以前那么昂貴了,我們可以實時更新數據。像這些數據的應用,對于軟體,對于硬件還要有一定的考慮。
當當第一層是銷售企業的應用,主要還是你相似的人在買什么,可能感興趣的人做一個考慮。第二個是供應商的,像當當的商品是上百萬種,在全國20個倉庫有40萬平方米,我們不可能在每一個倉庫都做平行庫存,無論是當當網自己還是供應商都是做不到的。所以我們要把我們的供應分成幾個級別,有的叫地方化倉儲,有些是起到一個蓄能的作用,很多是根據當地的購買情況去做調配,這個數據的應用是讓周轉更快,不斷貨,及時貼補,讓供應鏈更小。
像最近這些天特別熱的一個詞叫冰桶,現在可以區分冰桶是個社會現象,那我們還可以做點分析,它還沒有影響到某幾類商品的銷售,所以我們還要再去看哪些會影響消費行為,我們怎么在不同的角度認為是全國性普及還是地區性普及。
在當當網數據運行的第三個層次,我認為是平穩層次。因為網絡的常規性和大家的去中心化,更愿意聽人家去說什么,而不太愿意聽一個媒體權威說什么,所以人之間的影響半徑和溝通,跟三年前比發生了很大的變化。我們現在整個社交行為都發生了很大的變化,那這個產生出來的東西是會影響到很多顧客行為的,所以這種評論,怎么讓一個評論,就是有用的評論,相關性強的評論,怎么定義相關性?這個東西一定是巨大的計算量。統計,和很多用戶的屬性黏貼在一起,再給大家一個指南。
所以總得來說,像當當網這種基于互聯網,基于消費者行為的詞,他從第一天開始,數據完全是闡述公司行為的一部分。不管這個名字怎么叫,是數據倉庫,數據遷移還是大數據挖掘,我們永遠是以數據為生。對于其他一些行業來講,我們看到幾個事情。一個是數據和有用的數據之間千差萬別,數據哪兒都有,怎么把這個數據挖出來,提煉出對自己有用的東西是很大的挑戰。
還有一個東西想要納稅人為自己公司服務,一定要積累數據,我覺得很多公司和行業沒有底層可以使用數據。我們經常會看報紙說河南的菜賣不出去,實際上我就在想一個城市每年耗費的生活用品,白菜、大棗,一段時間是恒定的,除非都聽張悟本的,大家都吃一樣東西,這是很特別的形象。那到一段時間可能會有所波動,但是這些數據去挖掘和使用的很少。
還有經常有人把數據和信息兩個事情混淆,就是可以計算,可以公式的這個是數據,而信息是不可以切開處理的,做分析的。對于一個企業行為,商業行為和預測行為是相互的,我就講這些。
俞渝:我覺得有些公司從一開始就是以數據為生的,我認為電子商務行業就是這樣。因為電子商務沒有實體,然后做電商的公司,無論是準備商品還是他找到目標客戶,他所有全部都是數據。我覺得在2004年、2005年早期做當當的時候跟今天不一樣,我們那時候用一個詞叫數據挖掘。然后過了幾年那個詞改了,就是要根據挖掘出來的數據建立一些模型和倉庫,還有數據的遷移,大數據什么時候熱門的我沒有特別注意過。
我覺得以當當或者個案,或者是我們這個行業來講,數據的應用我想是分幾個層面的。一個是在銷售層面上,我們可能要推出,比如說還看了什么,還買了什么,還瀏覽了什么,他的歷史,和你相像的人,他在關注什么,這個數據是毫秒性的。以前計算成本比較昂貴的時候我們可能是幾天更新一次數據,后來變成當天更新數據,現在計算能力沒有以前那么昂貴了,我們可以實時更新數據。像這些數據的應用,對于軟體,對于硬件還要有一定的考慮。
當當第一層是銷售企業的應用,主要還是你相似的人在買什么,可能感興趣的人做一個考慮。第二個是供應商的,像當當的商品是上百萬種,在全國20個倉庫有40萬平方米,我們不可能在每一個倉庫都做平行庫存,無論是當當網自己還是供應商都是做不到的。所以我們要把我們的供應分成幾個級別,有的叫地方化倉儲,有些是起到一個蓄能的作用,很多是根據當地的購買情況去做調配,這個數據的應用是讓周轉更快,不斷貨,及時貼補,讓供應鏈更小。
像最近這些天特別熱的一個詞叫冰桶,現在可以區分冰桶是個社會現象,那我們還可以做點分析,它還沒有影響到某幾類商品的銷售,所以我們還要再去看哪些會影響消費行為,我們怎么在不同的角度認為是全國性普及還是地區性普及。
在當當網數據運行的第三個層次,我認為是平穩層次。因為網絡的常規性和大家的去中心化,更愿意聽人家去說什么,而不太愿意聽一個媒體權威說什么,所以人之間的影響半徑和溝通,跟三年前比發生了很大的變化。我們現在整個社交行為都發生了很大的變化,那這個產生出來的東西是會影響到很多顧客行為的,所以這種評論,怎么讓一個評論,就是有用的評論,相關性強的評論,怎么定義相關性?這個東西一定是巨大的計算量。統計,和很多用戶的屬性黏貼在一起,再給大家一個指南。
所以總得來說,像當當網這種基于互聯網,基于消費者行為的詞,他從第一天開始,數據完全是闡述公司行為的一部分。不管這個名字怎么叫,是數據倉庫,數據遷移還是大數據挖掘,我們永遠是以數據為生。對于其他一些行業來講,我們看到幾個事情。一個是數據和有用的數據之間千差萬別,數據哪兒都有,怎么把這個數據挖出來,提煉出對自己有用的東西是很大的挑戰。
還有一個東西想要納稅人為自己公司服務,一定要積累數據,我覺得很多公司和行業沒有底層可以使用數據。我們經常會看報紙說河南的菜賣不出去,實際上我就在想一個城市每年耗費的生活用品,白菜、大棗,一段時間是恒定的,除非都聽張悟本的,大家都吃一樣東西,這是很特別的形象。那到一段時間可能會有所波動,但是這些數據去挖掘和使用的很少。
還有經常有人把數據和信息兩個事情混淆,就是可以計算,可以公式的這個是數據,而信息是不可以切開處理的,做分析的。對于一個企業行為,商業行為和預測行為是相互的,我就講這些。
俞渝:當當不提供原始數據,因為當當網增值的部分是我們對于顧客的支持,所以這里面等于是我們把行為和產品他們想要什么東西我們理解完了以后,給他一些建議,原始數據是不會給的。
我再舉個例子,我們最近買了一個國外信息服務,他里面有一條,軟件數據他們可以給我們共享,我們看到以后立即把這一條取消掉。因為我們作為當當網來講,我們想數據可以和別人分享,分享的是成果,不分享的是數據,這是原則。
俞渝:我想更正一下,我們不賣數據,和這個數據是當當的核心能力兩者的關系。首先它是核心資產,這個核心資產我們涉及的是幾千萬顧客,十幾年的購買。真正去處理這些數據能力的人,除了我們自己別人除了不好,就是把生的數據,哪怕把張三李四都隱藏,給奶粉公司還是給房地產公司,他也抓取和使用不好,這個東西是很關鍵的。
另外有的時候我們也不能直接貨幣化,有時候我們拿一些成果去換了一些商品的折扣,或者是廣告的投入等等。所以它的變現形式不見得永遠是貨幣化的,跟其他也有關系。所以我覺得賣和不賣,跟抓取和處理能力是很相關的。
更多會議資訊、觀點、花邊、八卦,請關注微博:@財經會議[微博] 微信公眾號:財經會議。
已收藏!
您可通過新浪首頁(www.sina.com.cn)頂部 “我的收藏”, 查看所有收藏過的文章。
知道了