張亞勤[微博] 微軟[微博]全球資深副總裁 微軟亞太研發集團主席
演講主題:信息技術 重塑商業格局
張亞勤:我可能最后一分鐘改了好幾次話題,開始想講講第三次工業革命,但是感覺太宏觀了,看了一下,今天是行業論壇,還是講講行業方面的事情。
我最近一直在談一個話題,就是三個平臺的問題,看一下IT產業過去十年,未來的五到十年,整個競爭有很多方面,有新的技術,包括新一代的界面,大數據、云計算、SNS network,以及很多的數據挖掘、機器學習,更重要的,IT行業集中在幾個方面,尤其是三個平臺。
第一個是云平臺,云現在可以看到,有亞馬遜[微博]、有微軟,有Google、IBM[微博],很多跨國企業在花巨資建立云計算平臺,國內很多企業也在做這樣的事情,就是Cloud platform。第二個是PC的Platform,還有Smartphone,微軟、Google、蘋果,上演三國演義,我覺得很難有在這三個操作系統之外形成。
還有運用手機、汽車、電視以及所有的智能終端,Windows8推出之后,第一個月銷售四千萬,比Win7首月銷售還要好,是有史以來賣得最好的系統軟件,另外windows phone8推出之后,也是受到歡迎,包括HTC[微博]的mobile也是賣得很好。現在的Win8產品是去年同期整個銷售量的四倍。
整個來講的話,可以看到在終端操作系統平臺上面,有一個很大的瓶頸,第三個平臺是介于云和端之上的,社交、商務、通訊平臺,包括Facebook,包括微信、包括Skype,已經比較成熟了。
為什么爭奪這個平臺,云的平臺之外,將來的五年十年,新一代的IT格局會有主導權、話語權,更多是平臺之上的這些新應用以及軟件服務,或者說大數據。為什么說大數據最近變得這么火,如果大家從事IT產業的,特別是從事研究的話,會發現大數據做了很多年了,忽然這一兩年之內成為主流,忽然怎么時髦起來了。
我覺得有三個重要的V。
第一,數據越來越多,講產業,講三個V,就是海量數據現在每兩年的話,數據量就Double,在2010年年底,全球的數據量超過了2個Terabyte,過去兩年是有史以來的總和。
第二個,V就是數據它的多元化,現在的數據,有各種各樣結構化的、非結構化的,有互聯網產生的,有手機產生的,有實時信息,有離線信息,這些信息給我們過去的數據庫技術以及存儲帶來挑戰。
第三個V就是速度越來越快,位置信息,傳感器數據信息,毫秒級的處理。
另外一個驅動力就是云計算的興起,人類歷史上有如此之大的存儲計算能力,而且造價越來越低,我們以前采集存儲一個Terabyte是16萬美金(音),但是現在不到一百美元可以存儲一個Terabyte。
云計算和大數據是什么關系?其實是一個硬幣的兩邊,由于云計算,所以我們可以處理大數據,由于大數據,我們需要云計算,所以云計算應該是我們在大數據里面,是云計算時代的殺手級應用。就像在PC時代是Office,在互聯網是瀏覽器搜索,在云計算就是大數據殺手。
第三就是機器學習、數據挖掘,包括多少年研究的新理論算法,現在越來越成熟,可以使用大量數據,從很大量的數據,怎么樣變成信號、怎么變成知識、怎么變成信息,最后成為決策,這個遠遠比收集存儲數據更加重要,最后獲得Date information。
第四個V就是Value,大數在很多領域都已經使用了,我經常舉的例子,美國總統大選,兩個月之前,看一下奧巴馬團隊利用大數據,很聰明的一個團隊,這個團隊有一個首席科學家,本人就是數據挖掘專家,他上一次競選很好的利用了社交網絡Facebook和Twitter,這次用更先進的數據挖掘和人工智能工具挖掘。比如通過數據的分析,在西部很多三十到四十歲的女性比較喜歡他,所以通過跟他的合作,得到了很多選票。
同樣發現在東部,有一個演員叫Sara(音),也是深受四十多歲女性和三十多歲男性喜愛,也是通過這樣的方式,通過精準數據的分析,找到了搖擺的選民,投給了他們。
另外一個例子,就是紐約警察局,到紐約去,在八十年代、九十年代,都很緊張,紐約四十二街這一塊是最危險的地段,你現在去紐約,會發現紐約是全球最安全的城市,這里面很重要一點,就是利用了數據分析,到現在的DAS系統,大膽使用數據庫,思科和微軟開發的數據庫,進行了智能分析,清晰鎖定犯罪嫌疑人痕跡,犯罪地點,多種數據進行融合,降低了犯罪率。
另外大數據在科技方面也有很多的使用,我的一個同事叫Jemy Ly(音),做數據庫的鼻祖,他07年提出了科學的第四范式,他的什么理論?在早期,我們做科學研究,更多的通過是觀測天空、行星,找出一些模式。到了后來,通過方程式、公式,把物理現象通過科學公式來描述。到了后面八十年代后,計算機發明了,運用計算的能力,找到方程式所找不到的東西,大家很多人使用這些工具,現在數據越來越多,所以建立新的第四范式,就是很多科學分析,根據方程式、根據觀測、根據計算機計算、根據大量數據進行科學研究。這些在整個科學界是很大的震動,可能會改變進行科學研究的方式。
微軟做大數據很多年了,一方面是基于思科大的系統,第二個是基于開源的非結構化數據大的系統,我們最新的系統很好的融合結構化和非結構化的兩個優勢,結構化的設計好處是什么呢,它的整個ETL系統,是十分嚴密的、很精確的,有一個輸入就有一個輸出,在最短的時間做相應的反應。
新的大數據,沒有結構化的優勢在哪里呢,是說好多數據,有一個輸入,我不知道會有什么輸出,這是最大的區別,我搞不清楚我的系統會告訴我什么,這是目前大數據和過去商業智能數據很大的區別。我們最新的系統,有一個叫Pony base(音),很好的把非結構化和結構化的、關系型的和非關系型的、封閉的和開放的融合起來,對整個行業會有特別重大的影響。
總結一下,我們現在IT處于一個大變革時代,我們從PC走向互聯網,從互聯網虛擬社會走向更加物理真實的社會,大數據成為新的貨幣、新的能力、新的競爭力,所有企業要有大數據戰略,如果沒有這個戰略的話,就會形成一個鴻溝,被打到溝的另一邊。我的新詞匯就是數據鴻溝,希望在座各位小的企業、大的企業,都能夠很好的利用數據,把數據從虛擬黃金變成真正的黃金,謝謝大家。