如果真做“中國的OpenAI”,王小川這票我投了

如果真做“中國的OpenAI”,王小川這票我投了
2023年02月20日 10:34 PingWest品玩

  在“ChatGPT現象”掀起中國人工智能科學、科技企業界和創業投資界的眾聲喧嘩之側,前搜狗CEO王小川發了一條朋友圈,表達了一點不同的看法:

  “OpenAI的成功,首先是技術理想主義的勝利。中國需要自己的OpenAI,就需要技術理想主義。大廠受自己的業務牽引,追逐資本熱點的創業公司更動作變形。不止如此,這種理想主義還需要有愛國之心、商業智慧和學術尊重去獲得政府支持,推動企業聯盟和學術界協同。中國能誕生自己的OpenAI”。

  在互聯網巨頭和投資和創業領域大佬前仆后繼地宣布“下場”做中國的自然語義大模型熱火朝天之際,王小川的這條朋友圈并未引起太廣泛的關注和討論,然而它確實表達了一些審慎冷靜,又不無樂觀主義的不同聲音,甚至釋放了一些新的信號。

  首先,王小川用了“技術理想主義”一詞,定義了類似OpenAI的創業項目。它不僅僅是一個創業項目,更是技術理想的窮盡實驗。而技術理想主義需要一個時期不計成本與反復實驗的堅持,很難快速出結果。

  其次,王小川隱晦地批評了當下分別彌漫在中國互聯網巨頭之間和創投生態圈內的“ChatGPT熱”,總而言之,它們缺乏樸素和純粹的技術理想主義。

  最后,王小川強調了做一家“中國的OpenAI”不僅是科技企業和投資界的事,也是國家、政府和學術界共同“合力”的產物。它需要有堅定的中國立場,也需要學術界的大力參與,是社會大規模協同的結果。

  意外的是,這與品玩幾日前發布的《誰拖了中國ChatGPT的后腿》一文中的一些觀點頗有接近之處。該文指出科技巨頭并非進行大規模自然語義模型實驗模型的最佳實驗場;中國不少曾經漠視AI模型建構的VC和創業者近期對“大模型”異乎尋常的興趣背后缺乏真誠和長期性;以及“中國自己的OpenAI”,要有為全球自然語義模型提供中國智慧和中國解決方案的多樣性的理想和愿景。

  更重要的是,并不難發現,長期投身人工智能研發、特別是在自然語言深度學習領域長期浸淫,有技術理想主義情結;有足夠的商業智慧在復雜的中國互聯網商業環境中輾轉騰挪,做出最關鍵的決定;還有家國情懷,在學術界有良好的聲望、成果和人脈支持——王小川所提到的成功打造一家“中國的OpenAI”所需具備的關鍵要素,都在他自己身上得到了體現。

  你索性可以認為,王小川就是通過這條朋友圈,隱晦地宣示了自己即將進入“中國的OpenAI”這一關鍵戰場。

  據公開信息,2022年6月,王小川設立了人工智能技術公司——北京百方眾智信息技術合伙企業,自己占股80%。另據36氪向王小川本人求證是否回歸創業做AI大模型的消息,王小川承認自己在“快速籌備中”。

  品玩從接近王小川本人的消息源獲知:王小川確實已有具體的行動,正在與產業界和學術界的一些重要人士進行密集溝通。

  技術理想主義價值觀、清華天工智能計算研究院的學術背景、推動產業界和學術界開放合作的經歷、主導搜狗技術驅動的商業化產品落地的實操成果、擅長借力巨頭的創業者,加上“天才少年”的傳奇經歷,讓“中國的OpenAI”跟王小川劃上等號,成了值得期待的一幕。

  外界熟悉王小川,總是從他天才少年的故事開始——他1996年獲得國際奧林匹克信息學競賽金牌,進入清華大學。進入搜狐后,在2004年主導推出搜狗搜索,并旋即在27歲那年成為彼時中國互聯網界最年輕的高管。張朝陽形容他當時的團隊“全是精英”,主力即是王小川擔綱國際奧林匹克信息學競賽教練帶出的獲獎“隊友”。

  這些技術天賦逐漸轉化成實在的技術實力——搜狗輸入法的成功不僅對搜狗意義重大,作為最早的中文輸入法之一,它也給中文的語言AI打開了許多入口。2011年開始研究語音識別技術的搜狗團隊,也開發出第一個公開使用的AI同傳。

  這些語言AI技術的能力不一定能獲得最大的商業回報,卻是王小川“技術理想主義”價值觀的體現。

  “小川十幾年前就研究機器學習了,可惜在搜狐的體系下沒有足夠的資源,這也是他把搜狗獨立出來的原因”,一位接近王小川的互聯網界人士對品玩透露。

  ChatGPT今天的熱鬧,本質是大語言模型發展里的里程碑,而王小川形容自己在搜狗做的事,都是在跟語言模型打交道。“語言AI是人工智能皇冠上的明珠”,這是王小川多次在公開場合提出、頗具個人風格的論斷。

  常年浸淫輸入法、搜索、語音等技術領域,借助人工智能率先推出唇語合成和手語識別等創新的語言技術,也讓他和大語言模型更近,他也成了國內發展語言AI最積極的“鼓吹者”之一。他在公開的訪談中說:“只有掌握了語言,AI才具備創造力和推理能力。”

  王小川對語言大模型的“執念”,是20年以來有跡可循的,而不是“風口”上的一時沖動。也正是這種技術理想主義,讓王小川一直沒有遠離基礎科學和學術界。

  他參與共建了清華大學天工智能計算研究院,并擔任聯席院長,他同時也是清華大學計算機學科顧問委員會委員。這都并非虛職——他推動搜狗和清華大學等學術機構合作,做了很多實際的嘗試。比如當年包含1.3億原始網頁的SogouT開放數據庫,就以免費形式對科研機構開放,希望從語料的質量上推動國內技術的發展,也成為很多NLP研究者和從業者最常用的數據庫之一。

  在Google學術搜索引擎上檢索“SougouT”,能發現至少600多篇學術論文得到了這個王小川一手推動的開源數據庫的支持。

  在“獲得政府支持、推動企業聯盟和學術界協同”的課題上,王小川的思考和實踐,比大多數僅僅從投資風口和商業回報上考慮的人深入得多。當然更被大眾媒體津津樂道的,更多是他在中國互聯網商業進程里體現的“商業智慧”:

  在搜狗的發展中,他不僅全局操盤過算法、工程、數據等各個技術與商業結合的部門,更稀有的,是他游走大廠之間的經驗——從最初在張朝陽“反對”之下堅持創立搜狗,到后來幾個關鍵生死節點,靠個人智慧和努力,在最合適的時間點,先后爭取到阿里巴巴和騰訊的投資與合作,最大程度在搜狗的成長歷程里,保持了難度的自主性——這些過去的故事,與今天討論ChatGPT的過程中被反復提到的微軟與OpenAI的組合,竟然有頗多相似之處。

  從人們津津樂道的天才少年故事,指向帶有某種浪漫主義色彩的語言AI夢想,再將夢想照進一次躬身入局建設里程碑式中國語言大模型的現實實踐。如果真的有這件事發生,值得期待。

新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片