財(cái)聯(lián)社
北京時(shí)間周一深夜,創(chuàng)業(yè)未滿(mǎn)一年已成歐洲人工智能龍頭的Mistral AI連發(fā)數(shù)條消息——發(fā)布最新大模型Mistral Large、推出首個(gè)聊天機(jī)器人產(chǎn)品Le Chat,以及與微軟達(dá)成更加深入的合作協(xié)議。
Mistral AI正式成立于2023年5月。在去年這個(gè)時(shí)候,創(chuàng)辦這家公司的三個(gè)法國(guó)年輕人還分別在谷歌DeepMind、Facebook上班。
到去年12月,隨著英偉達(dá)、賽富時(shí)以及一眾華爾街資本揮舞支票,趕忙參與公司價(jià)值超4.5億歐元(接近4.9億美元)的融資,Mistral AI的市值已然超過(guò)20億美元。
(Mistral AI的三位創(chuàng)始人Guillaume Lample, Arthur Mensch, Timothée Lacroix都只有30多歲)
發(fā)布最新大模型&首個(gè)聊天機(jī)器人
Mistral AI周一宣布,正式推出最新旗艦?zāi)P蚆istral Large。公司聲稱(chēng)該模型具有“頂級(jí)的推理能力”,能用于處理復(fù)雜的多語(yǔ)言推理任務(wù),包括文本理解、轉(zhuǎn)換和代碼生成。
在AI理解能力測(cè)試基準(zhǔn)MMLU的對(duì)比中,Mistral Large的得分僅次于GPT-4,略好于Anthropic開(kāi)發(fā)的Claude 2。至于谷歌的Gemini Pro以及Meta的LLaMA 2 70B模型,則被甩開(kāi)了一個(gè)身位。
據(jù)悉,這個(gè)模型擁有3.2萬(wàn)tokens的上下文窗口。按照一個(gè)token約等于0.75個(gè)英文單詞的慣用算法,Mistral Large能夠一次性從接近2.4萬(wàn)個(gè)英文單詞的文檔中精確提取信息。
公司介紹稱(chēng),該模型對(duì)英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、德語(yǔ)和意大利語(yǔ)具有母語(yǔ)級(jí)流利程度,并對(duì)語(yǔ)法和文化背景有細(xì)致的理解。不過(guò)與一眾大模型一樣,實(shí)測(cè)下來(lái)中文也是能用的(后面有測(cè)試案例)。
當(dāng)然,最重要的是Mistral AI的開(kāi)源屬性——除了使用云服務(wù)部署外,還能直接下載部署到本地。與封閉AI模型的龍頭OpenAI不同,Mistral AI的大模型可以在“抱抱臉”等代碼平臺(tái)上下載,不過(guò)目前還沒(méi)看到Large模型的文檔。
公司也在周一發(fā)布首個(gè)聊天機(jī)器人LE CHAT,可以選用剛剛發(fā)布的Large模型,以及對(duì)延遲、成本進(jìn)行優(yōu)化的Mistral Small,還有一個(gè)名為Next的下一代原型模型。總而言之,提供了一個(gè)試用的窗口。
從短暫的上手實(shí)測(cè)來(lái)看,這個(gè)模型哪怕使用中文,回答簡(jiǎn)單的推理題完全沒(méi)有問(wèn)題。
對(duì)于美國(guó)歷史和法國(guó)歷史,這個(gè)模型也能答得上來(lái)。
不過(guò)在追加測(cè)試中,這個(gè)模型對(duì)中國(guó)文化歷史的了解可以說(shuō)是....慘不忍睹,不過(guò)Mistral本身也沒(méi)說(shuō)這個(gè)模型懂中國(guó)歷史。這也是國(guó)外開(kāi)源AI模型存在的通病。
微軟收購(gòu)公司部分股權(quán)
同樣在周一,Mistral AI與微軟宣布達(dá)成了一項(xiàng)新的合作伙伴關(guān)系。從公告上來(lái)看,雙方的合作主要包含三個(gè)方面:1、微軟向Mistral AI提供開(kāi)發(fā)和運(yùn)營(yíng)模型所需的算力;2、Mistral AI的大模型上架微軟云服務(wù),供全球用戶(hù)部署;3、雙方將探索合作,為特定客戶(hù)制作特定模型。
除了提供算力和云服務(wù)客戶(hù)外,這份合作協(xié)議也使得微軟持有Mistral AI“一小部分股權(quán)”。
值得一提的是,Mistral這個(gè)法文單詞的原意指的是“法國(guó)吹來(lái)的強(qiáng)風(fēng)”,公司創(chuàng)立的愿景是搞AI其實(shí)不需要那么多錢(qián),許多公司白白浪費(fèi)了非常多的資金。創(chuàng)始人兼首席執(zhí)行官Arthur Mensch直言,公司要做AI世界里資本效率最高的。
Mensch透露,周一發(fā)布的Large模型,整個(gè)開(kāi)發(fā)成本低于2000萬(wàn)歐元。作為對(duì)比,奧爾特曼去年提到過(guò)GPT-4的開(kāi)發(fā)成本可能要超過(guò)1億美元。
對(duì)于微軟而言,不管是代表封閉生態(tài)的OpenAI,還是開(kāi)源社區(qū)的Mistral或Meta跑贏,公司都將是AI賽道的大贏家。這三家的AI模型都已經(jīng)上架Azure的云服務(wù),現(xiàn)在美股“股王”還持有前兩家公司的股權(quán)。
(財(cái)聯(lián)社 史正丞)
VIP課程推薦
APP專(zhuān)享直播
熱門(mén)推薦
收起24小時(shí)滾動(dòng)播報(bào)最新的財(cái)經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)