轉自:上觀新聞
東北人、香港中文大學教授湯曉鷗,被業內稱作全球人臉識別技術的開拓者和探路人。他一手創立了香港中文大學多媒體實驗室(又稱MMLab),成為“計算機視覺界的黃埔軍?!?,國內大部分AI視覺企業與該實驗室都有淵源。7月6日,在2023世界人工智能大會開幕式上,這位人臉識別界的軍師,談及他三位大咖學生,開啟了另類“凡爾賽”。
湯曉鷗說,2010年,杰弗里·辛頓(Geoffrey Hinton)、約書亞·本吉奧(Yoshua Bengio)和楊立昆(Yann LeCun) ,這三位后來的圖靈獎獲得者,共同開啟了“深度學習”的大門。2011年,杰弗里·辛頓和微軟的中國學者鄧力,在深度學習語音識別上實現劃時代的突破。2012年,杰弗里·辛頓和他的學生又改進了卷積神經網絡,并在著名的ImageNet評測中將對象識別的錯誤率減半,計算機視覺領域由此掀起革命。但是,判斷兩張照片是否是同一人,人眼有97.53%的準確率,這一度被認為是人工智能算法無法超越的天花板。2014年,湯曉鷗團隊用原創的GaussianFace算法超越人眼,造出一個準確率達98.52%的“怪物”,隨即又立馬發布更逆天的DeepID算法,直接把實驗成績提高到99%以上。
憑借湯曉鷗的段位,當然早已無需多言自己的過人之處。但他想聊聊他的學生在深度學習領域做了些什么。
第一位學生名叫王曉剛,本科中科大少年班,碩士期間在湯曉鷗的MMLab,博士就讀于麻省理工,2009年從麻省理工回到MMLab做教授。2015年,由王曉剛帶隊,打敗對手谷歌,取得了中國學者在ImageNet評測中的第一個世界冠軍。
第二位學生何愷明,系2003年廣東高考狀元,在MMLab讀碩期間發表的第一篇文章,就取得了國際頂尖會議CVPR(IEEE國際計算機視覺與模式識別會議)的最佳論文。這也是CVPR歷史上產自亞洲的第一篇最佳論文?!拔耶敃r跟愷明開玩笑,你一出手就到巔峰,以后你的學術生涯就只能往下走了。”但湯曉鷗特別高興,此后何愷明去了微軟研究院和臉書工作,仍舊一路走高。在微軟研究院,何愷明把深度學習訓練的層級從2015年時的最多三層,拓深到了20多層。他在網絡的每一層引入了直聯通道,從而解決了深度網絡梯度傳遞的問題。而今,以Transformer為核心的大模型,也普遍采用何愷明當年所創設的結構。“總結起來,何愷明把網絡做深了,谷歌把網絡的入口拉大了,又深又大,才成就了今天的大模型?!?/p>
第三位學生林達華,本科在中科大,碩士在香港中文大學,博士在麻省理工。他2010年在麻省理工讀博期間,獲得NIPS(神經信息處理系統大會)最佳學生論文。林達華2014年回到湯曉鷗的MMLab做教授,第一項工作就是將實驗室開源,在沒有推廣投入的情況下,OpenMMLab純以口口相傳的形式,成為國際上最具影響力的視覺算法開源體系之一,目前用戶遍及全球140多個國家和地區,其中60%的用戶來自海外。林達華的第二項工作,是推出書生·浦語,這是我國首個千億參數多語種大語言模型;他第三項工作是推出全球首個城市級實景三維大模型LandMark,有2000億參數,覆蓋100平方公里。
“回頭看,王曉剛在深度學習興起的最初幾年,灑下了許多原創的種子;何愷明將深度學習的根基打得非常牢和深;林達華通過開源和大模型,讓深度學習枝繁葉茂?!睖珪扎t概括。
這些學生,讓湯教授不免感慨,“我不是在最好的時光遇見了你們,而是遇見了你們,才有了這段最好的時光。”剛抒完情,這位“被人工智能耽誤的段子手”又不改其幽默本色,他接著說,“這句話非常優美,富有詩意,也發自我的內心,可惜它也不是我的原創。這句話,是于謙老師的原創,是他的電影《老師好》中一句經典臺詞?!?/p>
“每天晚上睡覺前,我都是一邊聽著于謙老師的相聲,一邊想:這么有趣的靈魂,機器怎么可能超越呢?我不信?!?/p>
這位嚴謹而實事求是的科學家,最終用如此感性的方式,道出了AI可以為人類所用、但難以真正替代人類的真相。
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)