21世紀經濟報道記者李強 北京報道
北京時間5月11日凌晨,谷歌I/O開發者大會在谷歌美國加州山景城總部舉行。
自2016年發布Google Assistant以來,以AI First為核心戰略的Google每年都會在I/O大會上亮出一些AI領域的研究成果,不過總體來看,最后能夠落地為面向消費市場的實際產品寥寥,導致谷歌雖然作為大語言模型領域公認的開拓者和先驅者,但卻一直處于不溫不火的狀態,業界之外對于谷歌在AI領域近些年來的貢獻也知之甚少。
2022年11月,OpenAI旗下的大語言模型產品ChatGPT橫空出世,讓幾乎所有人都能夠明確感知到AI的驚人潛力,瞬間改變了整個AI行業的節奏,一直在底層技術研發和產品更新上不緊不慢的谷歌也充滿了緊迫感與危機感。ChatGPT的出現和微軟新版Bing的步步緊逼,為Google拉響紅色警報的同時,更是讓原本在AI應用方面一心求穩的Google不得不快些再快些。
2月6日,趕鴨子上架的谷歌匆忙發布了由大語言模型LaMDA提供支持的AI聊天機器人Bard。
3月14日,谷歌發布面向開發者和Google Workspace用戶的生成式AI工具與服務:如方便開發者快速進行原型設計和模型調整的PaLM API和MakerSuite、面向大規模模型和AI應用構建、部署的Google Cloud生成式AI產品等;在普通用戶較多的Google Workspace,谷歌也上線了包含Gmail智能撰寫、Google文檔自動摘要生成、文法潤色等工具在內的生成式AI體驗……
而不出意外的,本次發布會完全圍繞AI進行的同時,Bard和生成式AI應用也作為主角身份登場。
Bard“逆襲”
作為本次大會的重頭戲,谷歌公布了最新的大語言模型PaLM 2。
PaLM是Google在2022年4月宣布的大語言模型,使用了5400億參數進行訓練,約是GPT-3的三倍,此次PaLM 2又在PaLM上進一步進行了提升和改進,在多語言文本方面接受了更多的訓練,涵蓋了100多種語言,對于理解、生成和翻譯包括成語、詩歌和謎語在內的細微差別文本的能力非常顯著,還通過了“精通”級別的高級語言能力考試。
在推理方面,PaLM 2的數據集包括科學論文和帶有數學表達式的網頁,擁有超強的邏輯、常識推理和數學能力。
谷歌CEO Sundar Pichai在發布會上提出,谷歌在AI方面的愿景是“讓AI對每個人都有幫助”,對于產品落后感強烈的谷歌,敘事邏輯也更傾向于基于現有的產品基礎,讓AI在產品智能化上的效果更為顯性,而首要的就是將AI技術融入到旗下眾多的產品中。作為谷歌在這一波AI浪潮下最新的研發成果,發布會當天演示的一系列產品應用新功能也都是基于PaLM 2生成。
例如谷歌的最核心產品谷歌搜索,經過AI全新優化的搜索,對自然語言的理解力更強,更能理解用戶所想要真正表達的意思;基于谷歌自行研發的大語言模型,谷歌搜索結果除了過去的網頁搜索結果外,會在最上層顯示被谷歌成為“AI Snapshot”(AI快照)部分,這部分是由谷歌底層人工智能,根據開放網絡信息所總結出的信息。
此前發布的Bard是基于LaMDA開發,現在也已經全面轉用PaLM,在答案生成的數據組和更多元化的內容方面能力飛升,尤其吸引人的是,谷歌將Bard跟旗下和外部產品的集成,讓Bard跳出聊天機器人范疇,擁有更多實用性。
比如現在Bard提供答案時,除了文字之外,還能提供包括圖片、視頻、外部鏈接等多元化的信息,用戶也可以將這些問題答案一鍵導出到Gmail、谷歌文檔、表格之中,Bard還可以為圖片、文檔等做加標注,未來也將支持更多谷歌應用程序和Bard的集成體驗,包括Drive、地圖等。
對于軟件工程師們來說,Bard提供了改進后的代碼引用功能,在提供來源的同時還能解釋代碼片段。同時,開發者們也可以把Bard生成的代碼進行導出,不僅能發送到谷歌的Colab平臺,還能和另一個基于瀏覽器的IDE Replit一起使用。
目前,Bard能支持20多種編程語言,基本涵蓋了工程師們所有編程開發需要,并為開發者們提供了新的深色界面。開發者們只需輸入prompt就能得到完整的代碼片段。
此外,跟ChatGPT類似,Bard現在也可以跟其他外部工具進行集成使用。在開發者大會上,谷歌也展示了一個Bard跟Adobe Firefly合作生成圖片的例子,比如用戶想給孩子辦一個生日派對需要做一個請柬照片,只需要對Bard說:“制作一張在兒童派對上獨角獸和蛋糕的圖像”,接著在Adobe的支持下它會在幾秒鐘內生成四張圖像。
除了Adobe之外,Bard目前還在推進跟更多外部工具的集成使用,包括Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等。
此外,谷歌此次取消了等候隊列,Bard將面向180多個國家和地區的用戶全面開放。此外在英語之外,還增添了日語和韓語兩種語言,未來將逐步支持40種語言的交互。
AI“武裝”
本次谷歌一并推出了四種不同規模的PaLM 2。
谷歌用不同的動物來體現規模大小,從小到大依次是壁虎、水獺、野牛、獨角獸。其中“壁虎”版本是最輕量級的,能在移動設備上快速運行,離線狀態下每秒可處理20個token。
值得說明的是,在實際落地中,大模型不是參數量越大越好,在一些數據量小、任務并不復雜的場景,追求泛化能力強但規模龐大的大模型,無異于“大炮打蚊子”,如何將大模型核心的泛化能力快速適配至不同場景才是關鍵。
而不同規模的PaLM 2意味著其落地應用會更加方便,可以面向不同的客戶,部署在不同企業環境中,用戶甚至不用花費大量時間和資源來創建和調整PaLM 2,而是能夠直接拿來就用。
PaLM 2也早已經被用在了谷歌自家的25項功能和產品之中,除了Bard,另一個重頭落地場景是谷歌的全線辦公套件。
今年3月,追趕微軟的Microsoft Copilot服務,谷歌為其Workspace辦公套件增加了一系列AI功能,在本次開發者大會上,谷歌也正式將其命名為Duet AI。
跟微軟Copolit類似,Duet AI將被全面集成至谷歌旗下的Work Space,包括谷歌文檔、表格、幻燈片、會議、GmailMeet的自動會議摘要等等,同時還推出了一項名為Sidekick的新功能,能夠跨不同的谷歌應用程序進行閱讀、總結和回答文檔中的問題。
例如郵件的撰寫,只需要給谷歌一個主題,AI便能夠自動生成一段前后邏輯相對完整的文字;在生成PPT方面,也能夠運用AI隨時插入所需圖片以及每一頁PPT的大綱內容……這些功能在此前微軟發布Copolit時基本都看到過,Duet AI更多是展示了谷歌在AI產品上的應對和跟進能力。
此外,Duet AI也將被應用于谷歌云業務之中。借助Duet AI,谷歌云推出了一系列開發者工具,包括可以提供實時代碼幫助,指出錯誤的同時推薦生成的代碼塊,以及回答代碼和谷歌云相關的問題等。該功能支持Go、Java、Javascript、Python和SQL等多種語言。谷歌表示,目前在谷歌云上進行AI的訓練速度提高了80%,成本降低了50%。
但目前,谷歌辦公領域的Duet AI功能還沒有對公眾進行開放,如果想試用這些新工具,需要先注冊“工作場景實驗室(Workspace Labs)”并加入等候名單。
?。ㄗ髡撸豪顝?編輯:駱一帆)
“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)