快科技12月29日消息,小米在大模型賽場,頻頻按下快進鍵。
先是,“雷軍親自重金挖人,開出千萬年薪”的風傳。
據國內媒體報道,雷軍開出千萬年薪招攬了一位95后AI天才少女——DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉。
在B站上,羅福莉的ID是“我不是AI小蘿莉”,其簡介為“一位95后從事AI研究的小蘿莉,從北大碩士畢業,目前在阿里達摩院工作。”
公開資料顯示,羅福莉碩士畢業于北京大學計算語言學專業,曾在阿里巴巴達摩院任職,因在國際頂會發表8篇論文而走紅。
加入小米后,羅福莉或將供職于小米AI實驗室,領導小米大模型團隊。
羅福莉出生在四川小城一個普通家庭,甚至在上大學之前幾乎沒接觸過電腦。本科就讀于北京師范大學,保研進入北京大學計算語言學研究所。
2019年,羅福莉在NLP國際頂會ACL上發表8篇論文(其中2篇一作),迅速登上知乎熱搜而走紅。她提出的詞義消歧方法,和文本風格轉換框架等成果,推動了NLP技術發展,因而成為“天才AI少女”。
2022 年,羅福莉離開阿里,在 DeepSeek 擔任深度學習研究員,參與了 DeepSeek 的 MoE 大模型 DeepSeek-V2 的開發。
知情人士稱,雷軍認為小米在大模型領域發力太晚,于是親自挖人,重金招募能夠領軍小米大模型的人才,支付的薪酬水平在千萬元級別。
而后,又曝出小米集團AI大模型研發投入進一步增加,用于訓練和優化其AI大模型的GPU萬卡集群正在搭建中。
據界面新聞報道,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入,小米大模型團隊在成立時已有6500張GPU資源。
知情人士稱,該計劃已施行數月之久,雷軍在其中扮演了重要的領導角色。“在AI硬件這件事情上,最核心的是手機而不是眼鏡,小米在這個領域不‘all in’是不可能的。”
據了解,去年4月,小米正式組建AI實驗室大模型團隊,任命欒劍擔任大模型團隊負責人,向小米技術委員會副主席、AI實驗室主任王斌匯報。
對于小米對大模型和AIGC看法的問題,雷軍表示,小米在AI領域已經耕耘多年,有AI實驗室、小愛同學、自動駕駛等團隊。
“對于大模型,我們當然會全力以赴,堅決擁抱。我們正在研發一些有趣的技術和產品,等我們打磨好了,再給大家展示。”雷軍說。
對于小米而言,手機影像、汽車性能等故事已經被雷軍和高管們講得七七八八。
而同行紛紛發力AI和大模型,小米再不出牌就太被動。榮耀、華為、OV等幾乎清一色將AI提升到較高優先級,理想CEO李想直接宣布由汽車公司轉型為AI公司。還有消息稱,字節跳動在AI上投入巨大,2024年資本開支達到800億元,接近百度、阿里、騰訊三家的總和(約1000億元)。
有媒體認為,AI大模型之于小米,確實到了該拼產出、該講新故事的階段。
【本文結束】如需轉載請務必注明出處:快科技
責任編輯:朝暉
“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)