4月2日深圳IT領袖峰會的“人工智能:中國機遇與挑戰”分論壇上,百度Founder李彥宏、騰訊Founder馬化騰、微軟公司全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋、神州數碼董事局主席郭為坐而論道,主持人為IT達人,UT斯達康Founder吳鷹。
圍繞AI為何近來加速發展、目前的發展階段、難點、未來應用、AI最終能發展到什么水平,能否匹敵乃至勝過人腦,嘉賓們令人腦洞大開的精彩觀點很多,建議全文瀏覽,實在沒時間可摘讀標紅處。
以下為對話實錄。
吳鷹:先從馬化騰開始。剛才朱民演講中特別舉了你們這個團隊的例子,13個人真的是沒有一個人是會下圍棋的,騰訊有一個700多人、成立了大概一年多的人工智能團隊,專門研究人工智能,他們在很短時間內聚集了很厲害的一些專家。
能不能跟我們大家分享一下騰訊為什么在人工智能上這么重視,還有你對人工智能的看法和行業的看法?
馬化騰:其實李彥宏是人工智能走得更前了,對騰訊來說,我們還是落后不少,只是去年剛開始成立的部門。
當然在我們所有BG內部結合它的業務形態都有在落地,像我們微信里面,超過上百億條消息,包括我們圖片、特別是做社交網絡,里面有人臉數據圖片絕對是天文數字,每天高達上十億張有人臉照片。
這方面的技術研究在各個BG有相當長時間研究,包括后臺數據分析、廣告匹配都用了人工智能技術,只是大家感受不到。因為他在后端。我們在前端也希望做出一些產品,剛好一年前Alpha Go它的paper出來,通過人機對戰讓全世界對人工智能認知到了一個新的高潮,我們團隊本著練兵的心態也做了嘗試。
谷歌收購了deepmind團隊發表的論文,原來做計算機圍棋的團隊都紛紛采用深度學習方法來融入原有的似乎已經走進瓶頸的計算機圍棋軟件開發中,大家不約而同在這一年中起步。
我們內部團隊有三個團隊也在做,只是分在不同部門。這個部門剛好是它能夠突破這個瓶頸,也動用了公司相當的大的后端的計算機資源,更大的特點是它和Alpha Go不同的是我們“絕藝”AI的成長,全程得到了國家級圍棋世界冠軍從一開始的陪練,然后找出它為什么不同。我們十幾位研發人員不懂圍棋的,一開始連黑先下還是白先下的規則都不懂,我們從計算機原理、工程實現以及結合很多專家來訓練。
我們覺得這算是小小的成功吧,但是也不能過于欣喜,畢竟是站在前人肩膀上,因為你沒有發布這個paper,我們也不可能做出來,但是也不能說這是毫無疑義的事情。
這里面給我們最大的思考是,過去我們對AI多是從一些規則、從簡單的訓練得出來的能夠改善我們計算處理的這樣一種能力,最終我們發現其實還有一個更恐怖、更深層的意義在于他能夠在計算機的后臺用云計算、大數據方式高速的自學習,能夠自己跟自己對奕。
所以AlphaGo出來后,它的下一代master,經歷了數十億盤自我對弈,已經超越過去所有人類交戰的盤數,然后它自己尋找規律,找到的已經遠遠超過人類過去在圍棋領域認知的范圍,是極大的擴展,這是給我們一個很大的啟示。
在很多的領域——圍棋以外的領域,不管是醫療(剛才講的病理的檢測),以后的金融,現實中的每個行業,如果能用計算機后臺做出一個模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動駕駛怎么開車,就模擬一個現實環境,給它一個規則,讓它駕駛,它去撞,有各種反饋,自然會琢磨出一套理論和經驗,這是給我們帶來巨大思考。在很多領域如果能做出模擬器,定義出很多參數,自己學習,他能找到規律可能遠超我們現在想象的。這是我們最大的啟示。
吳鷹:謝謝Pony。沈向洋先生作為微軟人工智能事業部的負責人,你講講為什么人工智能這幾年能有突破性發展,能不能預測一下最可能在哪些領域具有顛覆性的應用出現?
沈向洋:謝謝吳鷹。我每次聽完馬云講話以后都沒有話可以講,馬云基本上把大家想講的都已經講完了。
我從研究生開始學習人工智能,也有二三十年時間了。現在看到人工智能如火如荼,非常激動。因為我們90年代中畢業的時候出來的時候工作都找不到,現在大家恨不得見到一個懂人工智能都投錢。
人工智能經歷了這么多個冬天,之所以今天有這樣的發展機會,主要還是因為三個方面原因,第一是因為互聯網的出現,互聯網+物聯網提供了更多的數據。第二是有了強大的運算能力。摩爾定律到現在,大家覺得應該會死掉,但是還沒有死掉,還有更多新的計算方法。第三是過去五六年深度學習的突破,包括騰訊研發領域充分運用到深度學習,令到大家突然看到很多不能解的問題現在可以解掉。
人工智能研究有兩個非常不一樣的階段。一個是人類感知這件事情上,我們講人工智能,原來對人工智能的定義就是跟人類智能相比較。人類的智能體現在哪?主要是兩方面,一個是感知方面、一個是認知方面。感知方面,剛才我提到這幾個原因,所以在接下來5-10年進展會非常快。具體表現在計算機語音和計算機視覺發展,我覺得AI會超過人。很多人會同意我這個說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智能的認知方面,包括自然語言,包括知識的獲取、包括你對一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。
您剛才提到現在人工智能給大家創造了一些什么樣的機會,從微軟公司來講,我們的研判覺得短期之內是有非常非常大的商機,你看到底有那些行業已經相對而言有相當大量的數據,而且同時在這個行業里面從屬人員是不高興的,那你就有商機了。
如果這樣看的話,到今天來講,幾乎所有的商業應用,從市場銷售到HR部門招聘,到客戶支持這方面,所有的都會被顛覆掉。我是覺得客服是接下來五年最多的AI應用的商機,我這樣講并不是說自動駕車不重要、圍棋下棋不應該做研究。只是具體回答吳鷹的問題,從我們來講最大的商機在哪,就是每一個商業應用都會被顛覆掉。
吳鷹:大家注意沈博士說每一個商業應用都會被顛覆掉。這是非常震撼的一個結論。郭為先生,你是神州數碼的掌舵人,你們在智慧城市方面有很大的布局,很多人會認為你們好像跟人工智能不一定有那么大的關系。請你談談你對人工智能的看法。
郭為:謝謝吳鷹。剛才沈向洋講到今天人工智能有一個比較大的突破,實際上就是三點:一個是由于互聯網出現,大數據出現。第二,計算能力高速度。第三,算法。
我們做智慧城市過程中,我們為企業定位過程中也考慮到,計算能力這個事兒我們做不了。第二,算法上。昨天研討會上,還有今天,大家認為中國目前還是落后、還是在學習階段。作為一個傳統企業轉型的話,唯一能做的就是數據,就是如何能夠采集到更多數據。
由于我們以前的積累,我們在很多行業有很多應用,使得我們能夠接觸大量的數據,這些數據如何從傳統的方式上轉移到用互聯網方式,或者今天我們定義用深網數據挖掘,如何在三網環境下采集數據就變成我們的核心競爭力。所以做智慧城市過程中我們是不斷探索這樣的工作,慶幸的是由于我們跟北大合作,使得我們在深網挖掘上有很大的變化,我們發明了相關技術,能夠快速生成API,為智慧城市打造了一個基于大數據操作系統,如何能夠快速形成一個城市數據,然后進行分析、應用,這就是做智慧城市的實踐,正是因為這樣一個實踐,我們花了6、7年時間,某種程度上也是碰得頭破血流。
我也很同意馬云的觀點,我們既不能把人工智能太深化,但是也要看到他確實還是能夠幫助我們做成一些事情。比如在一些特定領域里,在醫療看片子、制定醫療方案可以做的很好。比如在農業,由于土地確權,我們掌握了20億畝土地的信息,土地上有什么數據,我們幫助進行分析,提升我們農業收入,包括進入扶貧領域。這些應用是做智慧城市過程中一個非常好的方面。
總的來講,既要發揮神州數碼在傳統IT領域的應用上的特征,另外就是擁抱互聯網,擁抱大數據,如何在這個領域里面有一些技術性的突破,使得我們自己的企業能夠在這個領域做一些事情,這就是我們今天做智慧城市要做的工作。
吳鷹:百度在人工智能布局很早,而且深度學習上比美國很多大公司還要領先,這種評價并不過分,而且你在兩年前全國政協大會上提出中國大腦這個建議。對中國也是非常重要。從百度角度你能不能談談關于人工智能發展你們的看法。當年你們為什么那么早做這些布局?
李彥宏:我其實也思考過這個問題。從百度的基因來說,我們從一開始成立到現在最主要是做搜索。搜索本質上是機器試圖理解人想要的東西。
我們一開始用各種各樣計算機方法試圖理解人的意圖,我在想一個問題,深度學習在圖像檢索里頭的效果不錯,是一個偶然還是它代表一種趨勢。分析完之后,覺得它是代表一種趨勢的,它不僅僅對于圖像搜索有用,它對很多其他計算機科學要解決的問題都是非常有用的。原因就是,隨著互聯網這么多年發展,數據越來越多,越來越豐富,計算資源越來越便宜,越來越強大。
所以人工智能剛才說有60年歷史,前50年,為什么大家不看好,為什么大家覺得人工智能沒有用,我在美國讀書的時候,我就很喜歡人工智能這門課,但是學完之后,教授告訴我說其實沒用,人工智能沒有一個真正有商業價值的應用,你將來靠這個是找不著工作的。
到現在最近幾年,原來認為沒用東西變成有用,是因為市場環境變了,條件變了,原來認為不可能的事情現在變成可能了。
百度在分析了環境因素之后,覺得人工智能是代表未來的。所以我們在2013年1月份對外宣布成立深度學習研究院,這個可能是全球工業界第一個用深度學習來命名的這么一個研究院。
而且這等于我自己食言了,我2013年以前不斷跟外界說我們是一個商業公司,我們不應該成立研究院,不應該搞純的研究機構,這些機構要想轉化成產品,進入市場被市場所認可的話,應該跟那些產品部門、跟那些業務部門緊緊結合在一起,而不是單獨成立一個研究院,但是深度學習這一波起來之后,我覺得是完全不一樣的東西,他需要在理論上、在算法上,在很多方面有長遠的布局和突破,所以從那個時候開始大規模投入去吸引人才,去推進算法,其實不光是算法,在剛才朱民講的時候也講到各種各樣芯片結構層、CPU到GPU等等,都要審視算法的需求。
所以現在看起來人工智能比2013年我們決定進入的時候一個更要大的產業。前一陣我對外講了,互聯網其實現在只是一道開胃菜,真正的主菜是人工智能,所以人工智能不是互聯網的一部分,不是互聯網第三個階段,它是堪比工業革命一個新的技術革命。
吳鷹:開胃菜已經更大了,互聯網是人工智能的開胃菜,媒體可能會引用這個論斷,但是主菜得多大的市場。我覺得你跟沈向洋說的顛覆所有的商業模式,這個影響是非常大的。沈向洋,微軟人工智能事業部有多少人?
沈向洋:一共有7000多個工程師和科學家,我們還在繼續招人,并且Pony和Robin經常來挖我們的人,Jack也挖。
吳鷹:沈博士就直接進入火藥味比較濃的階段的,微軟如果進入中國,已經進入了,人工智能市場的話,BAT,你最想干掉馬云、馬化騰還是李彥宏?
沈向洋:借助剛才馬云講的,彎道超車十超九翻,要換道超車才有希望,在任何競爭的過程中總是要找到自己的出發點。
既然你給我這樣一個機會的話,我就提一下,微軟在中國最近這幾年推出的最了不起的人工智能叫微軟小冰,我不知道在座的有沒有用微軟小冰,可能在座的不是我們面對的用戶群,我這樣講你不要生氣,我們的用戶群是18-24歲相對的年輕用戶群,大家有時間和智能聊天機器人,這也是為什么我們選擇跟Pony這邊的QQ合作,也是針對這樣相對年輕的用戶群。
之所以我提這樣的人工智能產品和一般的智能助理還不太一樣。人類進化多少萬年下來以后,每天講很多的話,你可能不知道,其實男人在一天大概講幾千句話,女士一天可能講超過一萬句話。大多數的話并不是說講一句話一定要完成一件什么工作,我老師講大多數人一天講的話很多都是廢話,但是這個講話很重要,講話是人工智能里面最重要的一件事情,在很大程度上你的EQ是體現在你怎么去講這個話。我們推小冰的過程中學到了很多東西,我們現在主推的方向,研究和產品的方向就是所謂的對話式人工智能。
吳鷹:我沒用過小冰,但你好像還是沒有直接回答我的問題,你最想先干掉誰?
沈向洋:你剛才問了什么問題?
吳鷹:高手。我也想借馬云剛才講的問一個仿生問題,飛機剛出來之前,大家想的思路是看鳥在空中飛很羨慕,剛開始做飛機就想做一個像鳥一樣的。我就想問臺上的四位嘉賓,不用專業知識,就是直覺,在人工智能上有突破的事,模仿人腦的,你們覺得仿人腦的方式會有所突破,還是完全不一樣的想法?
郭為你就先說,說錯了也不要盡管,反正你也不是人工智能專家。
郭為:是功能性的突破,還是仿生的東西,就拿AlphaGo來講它下一盤圍棋所消耗的能量,有人告訴我需要2噸煤,但是一個圍棋手可能就是兩碗米飯。
我們在考慮一個功能的時候,需要考慮多大的資源消耗,這對于人類進步是很重要的。你可以實現這個功能,實驗室可以做得出來,但是無法實現工業化,就是要考慮成本,考慮到資源的消耗。
人工智能之所以用功能性替代就是考慮這些因素,就是完全模仿本身也非常困難。我也非常同意馬云的說法,人的大腦功能,我們自己認知只有3%,最終就是用功能,而功能的替代能量消耗要比人本身大太多,人還是太神奇了,這個我覺得很難達到人的程度。
我最近看一本書《人的宗教》,就講人是由三個東西構成,一個是你的生命,一個是你的心智,第三個是你的心靈或精神。我們反過來講精神的東西,我無法想象機器能夠代替精神的東西,最多也就是體力上能夠替代,智慧上不能,在某些方面的替代,完全替代人不可能,某些替代就是功能上的替代,所以突破就在功能上的替代,然后提高一定的效率,這是我對人工智能的看法。
所以我為什么同意馬云的觀點,實際上機器怎么樣能夠做得更好。我看遠古的博物館,人類發明一個針,這和今天人工智能的發明對人的沖擊是一樣的,當時人縫不了衣服,沒有針怎么縫衣服,發明針是多么神奇的事,能夠把衣服縫起來,今天做人工智能也和當年發明針沒有根本的區別,人在進步的過程中不斷發明新的工具,而新的工具最終還是為人類服務的。
吳鷹:Pony覺得是用模仿人的方式,還是全新的?
馬化騰:我們當然期待有一個本質的,發現飛機的螺旋槳也好,還是流體動力學,還是鳥的翼,或者是馬跑,現階段還是通過仿生的階段,在某一些垂直的領域,你現在要做到一個通用的AI非常難,包括圍棋也是選一個非常窄的領域,然后給它學習,通過各種參數來訓練。
剛才郭為提到的用AlphaGo下一盤棋要消耗多少能源。這個垂直領域訓練數據是需要消耗很大的能量,但在實際用的時候其實不需要消耗太大的能量。我們絕藝訓練出來的單機成本跟職業棋手差不多,但是要訓練出這個模型來要很長時間,稍微改一改規則就全部要進行重復訓練,改進一點之前的積累都不算,要從頭積累一遍,消耗的能量很大,而且時間很長,這是很窄的一個技能模擬。
現階段是仿生的,下一步到通用的,再下一步是不是有更本質性的,發現它背后的原理,智能可以超越人的碳基的智慧,是不是有其他更多的基礎元素可以形成更高級的生命智慧呢?這可能是超越人類現在所發現的知識,這也是有可能的。甚至有人還突發奇想說我們現在認識的宇宙就是高智能的生命,用他的量子計算機模擬出來的環境,我們一切都是模擬出來的,也有可能。大家發揮腦洞大開的想象力吧。
吳鷹:腦洞大開,一切皆有可能,Robin怎么看?
李彥宏:其實我不太認可人工智能現在做的是仿生學,現在我們講人工智能像是人腦神經元的工作原理,但是人腦具體怎么工作的,剛才馬云講的我們只了解3%,我們并不知道人腦是怎么工作的,你不知道它怎么工作怎么仿它?我們只知道這一點點,這一點點計算機的算法有一點類似之處。
現在的人工智能,尤其是機器學習、深度學習的算法還確實處在非常初級的階段,做得還非常不夠。什么時候能夠挑戰真正人的認知能力,我覺得還有很長很長的時間。
我說很長是說這一天永遠不可能來到。第一階段是弱人工智能,第二階段是強人工智能,第三階段是超人工智能,我認為到強人工智能這個階段就達到不了,不僅僅是你永遠搞不清楚人腦是怎么工作的,你即使用電腦的方法模擬人腦,要想完全達到人腦的水平,我覺得也做不到,永遠做不到。
吳鷹:我們IT領袖峰會就是觀點。我也不用問沈向洋了,因為確實是人腦到底怎么工作的,不知道。但是這個答案非常簡單,因為有一個上帝。所以很多科學家到最后就信上帝了,變成找到一個答案了。沈向洋,你還有補充?
沈向洋:我蠻贊成李彥宏剛才講的,人工智能這件事情發展,今天最大問題是對人腦不了解。
腦科學今天還是非常初步的科學,你每次要講科學的話,首先要一定要有數據,要能夠做試驗,而且做重復的試驗,今天就沒有辦法真正監測到真正做試驗說因為加入了這樣的輸入到人腦,出現什么樣的輸出。
接下來N年應該有更多的人投身基礎科學研究腦科學這件事情。看今天計算機體系結構,馮·諾伊曼結構,跟人腦結構完全是兩碼事??赡芤蚕駨埥淌谡f飛機的模仿并不是真正像鳥一樣,我覺得肯定是這樣的情況。
接下來,今天人能夠做的事情在不遠的將來,絕大多數事情,人工智能都可以達到。
我舉一個小的例子,比如今天大家講你今天可以做視覺識別了,物體識別了,你今天可以做語音識別了,那今天人還有什么事情很了不起,大家覺得通過學習的方法,我們可以達到一個什么樣的高度。很重要一件事情是機器閱讀,閱讀的能力。我要考高考、考SAT,閱讀一篇文章后,你問一個問題,我可以答一個問題。
像這樣的深度學習的能力,接下來5-10年可能是人工智能很大突破口,一旦有突破,搜索也好、社交網絡也好、其他商業應用也好,有很多的機會。
今天大家覺得激動人心的地方是因為以前是完全符號式、公式去做,今天是神經網這樣一種解法。它的區別在于以前符號式做法,你覺得用符號式做法解了一個問題,是可以解釋的,而今天這種神經網解法,包括Pony做的圍棋機器人,他很難去解釋為什么下這一步。
所以,接下來有一個需要研究的問題,從符號式到神經式怎么樣回過頭再到符號式,就是研究行業很熱門的方向,叫做可以解釋的人工智能。
吳鷹:咱們講了這么多人工智能的話題,講一點跟在座嘉賓更接近一點的,我本來想問李彥宏怕不怕微軟,想不想把它干掉,但是沒有什么意義,他們都有很智慧的回答,肯定會回避開。
但是我注意到百度你們的深度學習有一個開放平臺,咱們小公司在這方面沒有投入,沒有技術積累,想要用也是可以用,是免費開源平臺。這個是挺有意義。你們當年決定這么做的時候,你們不覺得這樣開放后會培養你的競爭對手嗎?
李彥宏:我覺得人工智能是一個非常大的產業,而且是會持續很長時間。像我們現在的判斷未來20-50年都會是一個快速發展的時期。
在這種時代大潮下,顯然不是一個公司能夠把所有的事情都做下來的。相反的,如果說我們先進入了這個領域,能夠提供一些平臺給一些尤其是沒有這么多計算資源、沒有這么多做長遠研發能力的機構去做他們擅長的,他們對于很多垂直領域可能比我們的了解就會更加深刻,讓他們去做的話,他會推動整個人工智能技術的發展。
所以從這個意義上講,我們把我們的平臺開放出來,對大家有益,對我們也有益,我們可以在平臺上看到大家在干什么事情,哪些方向發展會更快一些,哪些領域更適用于現在已經解決的技術。我剛才講人工智能永遠不可能超過人類的能力,但是當他逐步逼近人類能力的時候,其實已經是可以一個一個行業去顛覆掉。
比如說人臉識別這種應用,我們今天如果你去機場的話,要過好幾道安檢,又要把身份證拿出來,比對一下,其實人臉識別這個問題解決后,將來到機場就應該大搖大擺就過去了,他那個攝像頭可以識別,不需要一道一道檢查的。我們在家里自己開一個Party,可以每個人進來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現在比較笨的辦法一個人一個人對他的身份。
現在這個問題基本上解決了。比如百度大廈,我們那個閘機就是刷臉可以進,到哪兒直接過就可以了。這還是人臉識別一個東西。語音的識別、自然語言的理解等等,都是可以。
未來人和物的交流方式,人和工具交流方式,不是人學習工具怎么使用。人和動物的區別就是人發明了工具,但是人發明了工具之后,是發明人寫一個用戶手冊告訴你這個東西怎么用,電視怎么用、冰箱怎么用,這些東西,電腦手機怎么用,我們要學習用鍵盤,小時候都要學打字。
未來應該是機器、工具學習人的意圖,以后人再也不需要學習工具怎么用了,我要這個工具干什么,他就能夠明白,這就是我希望用人工智能方法解決理解人的自然語言,以后人和機的對話、人和物的對話就變成一種自然語言的對話,這是未來幾十年可能代表人工智能發展最大的方向。
吳鷹:確實這樣的話,從剛會說話的小孩兒1歲多到很老的老人都可以簡單使用計算機了。我想問一問馬化騰,微信,再加上QQ,這是世界最大的社交網絡,里頭有大量的數據。剛才前面發言人都重復講了,大數據是人工智能非常重要的方面。騰訊有沒有可能把數據分享出來,讓創業公司大家來用?
馬化騰:這個問題在內部我們也有激烈討論。
首先看人工智能我們關注那幾塊,第一個是場景。場景就是你想把這個技術應用在什么場景下,你是不是有高頻的跟用戶接觸,這是一個落地的很重要的地方。所以我們看到很多研究院也好,包括我們內部研發團隊。如果沒有場景落地,沒有平臺支持,基本上就是空中樓閣,研究一半很難往下走。
第二個是大數據。大數據也是從平臺、業務部門有大量實際運轉數據才能產生出來。但是這里面很多大數據是垃圾數據,因為沒有標簽,每人做規劃定義,用多好的算法也學不出來,學出來也是走火入魔,沒有用的。數據清洗、標簽化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗干凈,再讓AI學習。這里面是一個混合結合的過程。
第三,計算能力。也就是你有云的資源,拿幾十萬核的計算能力,CPU、GPU,我們還是有這個能力的。而且在云里面本身就可以很好的調用,這是我們第三個優勢。
第四個,一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們在微軟、在西雅圖還設置了一個實驗室。因為很多微軟的人不愿意離開西雅圖,所以我們就在旁邊設,沒有辦法,人才就是這樣。幾個方面結合起來才有辦法真正在某一個領域看到它的成效。
我們現在觀察到很多的AI所謂的大拿們,他們更關注怎么落地,能不能把畢生研究成果能夠體現出來,所以在我們內部在吸引人才的時候,往往也會說你們微信、手機QQ里面的平臺數據能不能給他們用。
但是事實上大家都知道,BG、部門里面的平臺他們也很希望近水樓臺先得月,數據就在我身邊流動,我為什么不能招人先研究一把,為什么給你呢?我們現在還處在內部怎么把數據分享出來這個階段。
當然這里面還有一個用戶很關注的個人隱私:別把我的數據都賣了,到時候大家都知道。這里面還有一個很復雜的信息安全個人隱私脫敏,你是不知道無法根據數據倒推到哪一個人做了什么事情,我們要把這些處理干凈才能往下一步談。
這里面數據清理到什么標簽,才能給其他部門、包括外部合作伙伴怎么用。同時有很多數據來自合作伙伴,業界其他公司,他們也遇到這樣的問題那者一堆裸數據不怎么用,這樣業界還要有一個標準,互惠互利交換,這是一個大方向,還有很長的路要走。
吳鷹:大數據清理之后,有針對性的,對業界別人是一個價值,別人也是一個補充。我相信人工智能是一個全社會的協調最后發展的過程。剛才朱民講有那么多問題,所以政府也要介入來做。
其實還不光是中國,是一個世界范圍內大家協同做一些事情。微軟如果大家愿意跟你們合作,你們是不是感興趣這個事情?
沈向洋:你剛才問Pony這個問題問的非常好,作為大公司來講,特別是成功大公司來講,我們對社會有一個責任,對行業有一個責任。當我們行業做的很成功,第一件事情就是開研究院。現在Pony也開研究院,唯一做的不對的就是開到微軟門口去了。
我也想分享一下在微軟的工作經驗,你說叫這些大公司把數據拿出來,讓初創公司或者其他公司去用,我覺得不見得很現實、不見得很容易,Pony剛才解釋的很好。但是我想鼓勵大家,很多的數據如果我們愿意花時間、花精力做一點處理,就像Pony剛才講的,然后讓研究人員去用,完全是可以做到的。
我們微軟出了兩個數據集,一個是計算機視覺標準方面的集,這樣可以做數據分割、物體分割。最近做了另外一個數據集是在自然語言,希望有一批新的做問題問答。這樣推動研究領域,大家在標準集下,不斷把標準集數據越做越多。我們做的方法是用搜索引擎數據,非常小心處理過,包括很多隱私的問題等等。拿出一些數據讓大家做研究是非常實際的,完全可以做到。
吳鷹:Pony大家很支持你的觀點,將來我們也期待像BAT這樣的大公司,不但是說數據拿出來分享,剛才Pony還主動提到包括運算能力分享都有可能來做,這樣對創業公司、中小公司,包括政府、研究機構特別是大學,非常重要。
其實利潤這個事兒對企業在某些方面是制約企業發展的,他一定要完成這個利潤,他是一個上市公司要做到這些。這就相對的眼光短一點。但是郭為你轉型在智慧城市上鍥而不舍做了6-7年的積累,我剛開始一直打擊他,你跟政府做很多事賺不到錢,你跟政府收多收少都不合適,你們跟人工智能有關的發展上有沒有一個規劃,還是希望跟這些公司合作在人工智能方面的發展?
郭為:今年發生了一個比較大的并購案,就是英特爾收購了?Mobileye,Mobileye是以色列的一家公司,做汽車駕駛輔助的,Mobileye在1000萬輛傳統的汽車上裝載了數據采集的東西,每天收集的數據量差不多相當于現在3000億個個人生成的數據量,由于有這些數據將會支撐因特爾未來在超算上,在大數據領域的發展。
神州數碼整個大的體系就是想利用我們在傳統行業的優勢去挖掘,剛才講深網數據,金蝶是做ERP的公司,ERP的數據是不可以在互聯網上直接進行傳輸的,它是深度應用的數據。
今天BAT很大的優勢就是在互聯網上已經完全壟斷了數據??陀^講只要他們不犯錯誤的話,別人是沒有機會的。當然企業犯錯誤是必然的,只是說在哪些方面不犯錯誤,對未來的看法一旦哪個地方出現空位的時候,其他新的公司就出來了,比如Mobileye十幾年在數據上的積累,一下子就被大家認可了他在輔助駕駛上的能力。
我們在農業、醫療、制造業,我們給工商總局做廣告登記的服務,那也就是全中國所有的商標注冊登記,我們掌握了全中國所有的商標注冊的公司,你的企業究竟哪個商標用得最多,哪個商標價值最大,我們完全可以通過數據分析的辦法來做,這里面蘊藏了大量的商業價值。
這些東西怎么做?我覺得就是要和現在成功的,或者說在人工智能上走在前面的公司去做,發揮我們的優勢深網數據挖掘,然后脫敏,打上標簽,然后和別人合作把這個東西做好。這個就是我們要做的。今天我去跟BAT在互聯網競爭,那我是找死,那是完全不可能的事情。
李彥宏:合作的空間是巨大的。
郭為:但是數據是可以一起合作的。
沈向洋:還是跟微軟合作比較好。
吳鷹:好,有點味道了,李彥宏和Harry都在向你遞橄欖枝,你要聽話聽音,你做苦逼活那么多年了,很多數據在后面做了很多苦活。今天在臺上的嘉賓,雖然Harry一直沒有回答我的問題最想干掉誰,但還是非常精彩的答案,我們開了一個非常好的頭。
【嘉賓們頻繁提及的馬云演講】
在中國,絕大部分制造業企業都在罵互聯網,我希望大家思考一下:互聯網不是替罪羊,也不應該成為替罪羊。
前兩天,我聽到有人說線上線下征稅不公平,這是一個偽命題。不要盯著那些小企業交了多少稅,而是應該盯著那些小企業有沒有賺錢,有沒有利潤,有沒有活下來。
不應該講彎道超車,而要講換道超車。彎道超車十超九翻,可能性真不是太大,只有在另外的道路上超車才有可能。在未來的云計算、移動操作系統、移動智能芯片、人工智能上,中國是有機會的。
前兩天杭州有一個搶劫犯,連搶三個超市,結果搶到了1800塊錢人民幣,還被抓起來了。因為杭州大家支付都是用支付寶,微信支付。在杭州還有一個叫龍江橋的菜市場門口,有一個叫花子,在門口放了一個二維碼,大家可以用二維碼付錢。強大的變革連強盜、叫花子都開始改變。
當我們認為技術摧毀就業的時候,其實技術在重新創造無數的就業。我們以前老是擔心城里農民工這么多怎么辦?房地產沒了,農民工去了哪里?去了快遞,解決了社會巨大的問題。
去年的IT領袖峰會,我晚上參加了研討會,大家把AlphaGo下圍棋說得天花亂墜,很恐怖的樣子,我個人覺得,So TM What?機器如果做人能做好的事情,不算什么,機器下圍棋打敗了人,只是侮辱了一下人而已,機器要做的是人類做不到的事情,這才是本事。
虛擬經濟真正的主體是什么?是銀行,是金融界。中國人不敢罵銀行、金融界,因為一罵,你貸款就貸不到了,所以大家就罵互聯網。
實體經濟和虛擬經濟本來就不應該對立的,實體經濟現在難,我告訴大家,全世界都難;虛擬經濟強,其實虛擬經濟中的垃圾也很多。我自己覺得,我們不能一方面要轉型升級,一方面又要對落后的產業保護,我覺得這是不靠譜的。
小型企業創新是靠產品,中型企業創新是靠技術,大型企業創新靠制度。
營養不良的人,像我一樣,看起來瘦瘦的,非洲難民一樣,當時稱之為“東亞病夫”。但是人到今天為止,我們去思考過沒有,如果你的知識結構不良,你的智慧不良,你的整個文化體系不良,其實是很可怕的,這才是我稱之為“網絡病夫”。我們國家在網上人越來越多,但是體現出來的網絡病夫越來越多,不懂裝懂,水軍橫成。
進入【新浪財經股吧】討論