首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

張寶峰:開發計算機的學習能力

2014年11月17日 16:40  新浪財經 微博 收藏本文     
“中國國際高新技術成果交易會”的重要組成部分——“2014中國高新技術論壇”于11月16-18日在深圳會展中心舉行。上圖為華為諾亞方舟實驗室主任張寶峰。(圖片來源:新浪財經 梁斌 攝)   “中國國際高新技術成果交易會”的重要組成部分——“2014中國高新技術論壇”于11月16-18日在深圳會展中心舉行。上圖為華為諾亞方舟實驗室主任張寶峰。(圖片來源:新浪財經 梁斌 攝)

  新浪財經訊 “中國國際高新技術成果交易會”的重要組成部分——“2014中國高新技術論壇”于11月16-18日在深圳會展中心舉行。上圖為華為諾亞方舟實驗室主任張寶峰。

  以下為演講實錄:

  張寶峰:我們實驗室是很少公開露面的。我們實驗室本身更多的關注是技術本身的東西,所以我今天更多的會在技術路線上做一些理解。

  這條線一般叫做忽悠曲線,13年是炒作的巔峰,但是14年是慢慢的下滑了,在整個曲線上大家可以看到一些新的技術,包括機器人,包括我們提到的這種智能制造,工業互聯網,以及工業4.0,我們看到大數據的時候,其實這個定義是我們個人最推崇的一個定義,它強調的其實不是說大數據本身的數據處理的復雜度,更多關注的是數據的價值,大數據是需要能夠帶來更強的決策力、洞察發現力,這些東西都是從流程應用角度出發的,大數據始終代表的是一種資產,一種資源,首先代表的是一個產業,從關注數據本身的內容,到關注數據本身的價值。

  它實際上需要一個產業的伸展,需要更為復雜的數據的處理能力。我們再看的時候,數據是不是到底有價值?數據是不是垃圾?這里面有非常經典的兩個對比,一個是右邊的話是數據倉庫,在數據倉庫中95%的數據一但存下去基本上就不用了,現在最大的一個問題是什么?就是成本問題,當我們說大數據是石油的時候,其實你挖石油也是需要成本的,我們看到一個真正實際的例子,這是13年的時候,一個加拿大基金的一個例子,在傳統的時候以一種典型的模式就是大眾營銷,大眾營銷基本上來講就是現在的騷擾短信、騷擾廣告,我們可以采用發傳單的方式,這時候可以看到,這支出了42萬美金的情況下,他的凈盈利是6000美金左右,是負的,是虧損了。

  大家可以看到,它產生的直接收益是25萬左右,這左右兩個表的對比,就是我們前面說的,數據之所以有價值,它產生的產業價值是什么?數據挖掘的成本要必須為商業所覆蓋的時候,才可以說明大數據是真正的金礦。

  我們說的機器人也好,制造也好,其實大數據里面有一個不得不面臨的問題,就是數據量確實太大了,我們認為以前的系統無論怎么去處理都無法去解決,我們在傳統的系統里面設計的往往是一個復雜的模型,在一個復雜環境里面做出來,但是很不幸的是這種模型很不好,我們換了任何一個場景,新加任何一個變化的時候,都會產生很多的不適應性,我們看到的一個趨勢,在這個時代里面我們不是強調計算機的算法有多強大。人是如何學習的,計算機可以不可以復制他,這是不得不考慮的一個問題。

  我們希望未來的機器可以在自己的數據和業務系統的反饋中產生自己學習的能力,產生一些可復制、成長的模型,這樣的一個需求就必然導致未來的時代的一個變化,這里面最普遍的一個觀點還是監督學習,就是說我一個標注,這些標注的學習過程中會產生一個模型,用于預測。

  這里面有一個很大的問題,為什么這個時代才可以真正做這個事情?其實就是底下這個公式,我們也是挺崇拜這個公式的,這個是奧卡姆定理,在以前的時候,沒有像現在廣泛的數字化生產的條件下,其實對于所有的科學家來講都是不可獲得的,在這部分,只有這個時代到來的時候,當我們所有面臨的一切都會自然而然的被數字化的時候,才有可能真正產生大數據時代的一個變革,這個變革本身就是無限制的成長性。

  我用幾個例子來跟大家分享一下,第一個是華為公司的,這里面我要提到的一個問題就是標注的問題,在大數據里面其實樣本空間很大,但是很不幸真正的標注空間非常小,這里面有一個很重要的問題,就是我可以不可以解決從少數的一些標注蔓延到整個數字空間里面,在華為的應用商店里面差不多有12萬左右的APP,1800多萬的用戶,但是我們沒有能力去看我們的用戶下載了什么APP,所以我們只能有一個小的算法,通過用戶本身來去學習,用戶A下載了什么什么,用戶B下載了什么,如果用戶A還下載了其他的應用,我們就可以去看這類人群是不是一個學生的特征,如果可以用機器來分好類了之后,就可以把1800多萬的用戶進行分類,通過這個就可以很好的解決在大數據樣板空間里面標注不夠的一個問題。

  另外一個問題,其實就是廣泛的數據關聯和知識管理的問題,在大數據里面,其實不可避免大家提到大的時候,其實往往強調的是多元的數據,我們在很多地方不經意留下的一些數字都會被很多的網絡所使用。

  我們其實有一個網站,其實主要是給我們公司的內部的服務工程師使用的,這個里面有一個很大的問題,就是我們每年幾十萬的案例庫在導入了之后,其實用戶很難使用這些東西,所以就要把問題單和案例庫變成一個知識,同時提供了一個搜索的平臺,使它可以快速的找到我新的東西可以運用的歷史的庫。

  還有一個翻譯的東西都是可以大幅的提升整個產業效率的,我這里想說的話廣泛的數據關聯是大數據必不可少的一個數據,我還想說一個,就是大數據并不是很神秘。

  另外一個,我想跟大家分享的是一個非常實際的例子,我們有個客戶,希望我們給他做克隆,在傳統的體系里面我們是請了一些專業的人士來評估的,有哪些問題已經暴露出來了,經過我們的克隆之后,我們希望可以達到什么樣的滿意度,滿意了以后,用戶可以更好的使用這些網絡服務,這樣的一個預測,基本上也要1到2天的時間,而且要請一些網絡服務工程師里解決,即便這樣的話,20多年的評估經驗也只可以大家50%多的精度,我們請專家配合幫我們選了一些,我們也可以看到,誤差率只有15.28%,這還是一個所有站點的平均情況下最差的一個站點的預期情況,我們真正的一個實際效果只有2.68%,這里面提到的就是一個如何用機器學習去解決以前傳統的問題,在我們的生活邊上,或者大家的企業里面相信有非常多非常多這樣的問題,我們只要能簡單的使用一些算法就可以解決大量的勞動或者是知識依賴性比較強的一些東西。

  機器里面有一個很好的東西,具有很強的復制性,只要選擇一個合適的模型,這個問題的分析也是在5分鐘之內可以就分析出來。

  我們另外一個例子是網絡本身,這一部分現在在整個業界里面也是非常熱的,在SDN,這個里面強調了一個問題,就是如何適配運營層的一些需求,我們要去算網絡的變化,我們希望在未來的時候可以不可以由機器去學習,因為機器可以非常實時的預測出來流量的趨勢,我們可以不可以通過機器本身的算法去做,這里面是屬于非常快速的學習和不可能反復性的學習,在這種網絡流量里面,一個數字中心每天的流量可能達到了TB級,在這種流量沖擊的情況下,我們是不可能把所有的數據記錄下來的。

  這是另外一個,我們可能希望達到的就是未來的網絡的資源調度是通過計算機和計算算法本身的東西不斷的成長、滿足自動化的需求,以實現最高效業務的調度和平衡網絡傳輸的負載影響。在這里面這幾個問題,都從各個方面強調了,華為本身的傳統業務里面,大家覺得可能跟大數據并不是相關的,但是我們會找到非常多的使用的情況去解決它,所以我們想說未來的話從技術方向說還是兩個趨勢也是歡迎大家,如果有志向,有希望、有意愿去做的話也可以去做。

  1、牽引學習。人可以在不同的領域里面去學習一些知識,我們希望計算機也可以做到這一點,在一個新的系統里面如何啟動的問題,這都是計算機系統很難,或者是基本沒有辦法去解決的一個挑戰。

  2、終身學習。在大數據里面我們既希望于計算機可以具備慢慢的學習能力,到目前來講我們整個國際上都沒有辦法去講智能是什么?是一個大學畢業生才可以解決這個智能系統的要求,還是一個3歲的小孩呢?我們是要通過不斷的量化,終身的考究來打造一個終身學習的系統,使人本身的代入成本會越來越低,這個也是  目前最關注的兩個課題,也希望在未來的時代里面有機會跟在座的各位在某一些場景里面進行一些的協同研究。

  總結一下,我們在華為里面更多的關注是打造一個具有學習能力的大量平臺,我們希望在未來的時候可以跟在座的各位一起在這個方面取得一些突破,謝謝大家!

文章關鍵詞: 高新技術論壇高交會轉型升級

分享到:
收藏  |  保存  |  打印  |  關閉

已收藏!

您可通過新浪首頁(www.sina.com.cn)頂部 “我的收藏”, 查看所有收藏過的文章。

知道了

0
猜你喜歡

看過本文的人還看過

收藏成功 查看我的收藏
  • 新聞支持占中者撐傘參加畢業禮 校長拒頒證
  • 體育NBA-科比44分湖人慘負勇士 火箭勝雷霆
  • 娛樂周董大方公開戀情 首曬與昆凌親密合影
  • 財經國務院37天連出9拳擴內需 調控精灌滴灌
  • 科技聯通終止小靈通背后:或為4G讓路
  • 博客揭秘1962年中印戰爭中國撤軍真相
  • 讀書優劣懸殊:抗美援朝敵我裝備差距有多大
  • 教育新浪教育盛典報名 教育APP評測報告
  • 楊德龍:滬港通給A股帶來增量資金
  • 金巖石:大國全球博弈的新棋局
  • 黃人天:黃金價格暴漲暴跌的秘密
  • 劉姝威:哈工大控股工大高新的目的
  • 易憲容:國內投資者如何應對滬港通
  • 張化橋:央行放水越多 市場利率越高
  • 徐斌:現在是中國大牛市的第四回調浪
  • 許一力:滬港通開通注定是極不平常的
  • 童大煥:成思危說政府不允許樓市崩盤
  • 馬光遠:不會出現海外投行鼓噪的崩潰