阿里通義上新:AI終于能做真正的PPT了!還免費

阿里通義上新:AI終于能做真正的PPT了!還免費
2024年09月02日 05:39 快科技

這年頭,哪有人上班不發(fā)瘋的(doge)。

就拿PPT來說,趙曉卉“PPTSD”這詞兒一出,那真是戳到了打工人心坎上。

對啊,PPT是什么高貴的東西啊!都大模型時代了,就沒有哪個AI能又好又快地幫我搞定這事兒嗎!

還真別說,打工人是會心疼打工人的。就在編輯們孜孜不倦尋找解放雙手的大模型工具的日常中,誒嘿,最近還真又挖到了新神器——

通義直接在網(wǎng)頁版里上新了“效率”版塊,功能很直給:實時記錄、閱讀助手,還有PPT創(chuàng)作。

其中,PPT創(chuàng)作屬于是新鮮出爐。

簡單來說,主打一個功能是大模型給的,但并沒多大“AI味”。

最關(guān)鍵的是,免費。

這咱不得抓緊測試一波——

拒絕PPTSD

具體來說,通義PPT創(chuàng)作主要提供了兩種PPT制作方式。

一句話主題生成PPT:

如果你啥思路沒有,只有一句話主題,那么可以把主題當(dāng)成Prompt直接扔給大模型。

當(dāng)然,如果你已經(jīng)有完整的思路大綱,它也支持最多10萬字的超長文本輸入。

上傳文件生成PPT:

文檔、音視頻文件都支持。

那么就,先給又菜又愛玩的手殘黨同事們,搞一份《黑神話:悟空》攻略(PPT版)吧。

提示詞很簡短,就是:《黑神話:悟空》游戲攻略。

一份像模像樣的PPT大綱秒速生成:

哪里看不順眼可以上手修改,懶人黨也可以直接下一步——選模板。

在不提供任何背景資料的情況下,通義生成的PPT能達(dá)到什么樣的效果?

點擊“生成PPT”,等待不到1分鐘,答案即刻揭曉。

應(yīng)該是基于通義大模型的聯(lián)網(wǎng)搜索能力,生成的游戲介紹里,《黑神話》的制作方、游戲引擎等重點信息都沒出錯。

不過大模型本身看上去并沒有被“劇透”,在具體游戲內(nèi)容上,有點腦洞大開。

但話術(shù)組織,設(shè)計排版,還真可圈可點。

單看這文案,確實沒什么AI味兒,說得上是言之有物。

人機協(xié)作修改起來也很方便:

點擊文本框既能直接修改文字,也可以一鍵召喚大模型幫忙一起優(yōu)化文案。

配圖同樣可以交給AI生成。

不會寫提示詞也沒關(guān)系,通義PPT內(nèi)置“咒語書”,點擊即用,也可以作為參考。

看樣子,日常用來糊弄老板妥妥夠用了(不是)。

上傳文件生成PPT

咳咳,還是回到正經(jīng)用途上,如果喂給通義PPT更詳細(xì)的文檔資料,它又會表現(xiàn)如何?

比如,投喂一份內(nèi)部培訓(xùn)資料,讓通義PPT來幫忙搞定培訓(xùn)PPT。

效果上be like:媽媽再也不用擔(dān)心我開會前做不完P(guān)PT。

PPT生成的內(nèi)容和上傳文件關(guān)聯(lián)性很高,基本上把文檔重點都劃出來了,直接拿來用問題也不大。

簡單總結(jié)一下,通義這波上新的PPT創(chuàng)作,具有以下幾個優(yōu)點:

言之有物:做到了生成文本更像人話(去AI味),并且不是片湯話,能結(jié)合用戶需求和上傳文件輸出有信息量的PPT內(nèi)容。

模板豐富:提供了各個不同場景、行業(yè)適用的PPT模板,設(shè)計美觀,大學(xué)生到上班族都能用。

智能編排:提供了全流程智能編排的能力,可在線實時調(diào)整PPT模板編排、PPT配圖智能生成、PPT文本智能改寫等。

進一步扒拉了一下,通義PPT背后的基礎(chǔ)模型是通義千問大模型2.5,相比上一版本,Qwen 2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,性能超越GPT-4 Turbo。

在對長文檔的支持方面,通義PPT支持1000萬字長文檔,包括PPT、PDF和網(wǎng)頁。

多模態(tài)方面,支持上傳最長6小時的音頻、視頻,也可以輸入鏈接導(dǎo)入線上音視頻。

文生圖功能,則是引入了通義萬相的能力。

三合一“通義效率”

值得一提的是,與PPT創(chuàng)作共同存在于通義效率版塊的,還有另外兩個功能:

實時記錄,以及閱讀助手。

不說不知道,這兩者其實都是通義用戶的老朋友。

實時記錄,原通義聽悟,是音視頻內(nèi)容方面的AI助手。

應(yīng)用場景聚焦課堂記錄、會議記錄,能完成的工作,包括語音轉(zhuǎn)文字、發(fā)言人區(qū)分、智能總結(jié)等。

界面非常簡潔,選擇語言(能識別中、英、日三種語言),確定需不需要實時翻譯成中文,即可開始在線錄音。

外教課or國際會議,不用愁了。

在通義實時記錄,錄音是實時的,語音轉(zhuǎn)文字是實時的,英文/日語錄音轉(zhuǎn)譯成中文是實時的。

連邊轉(zhuǎn)文字邊修正錯別字,也是實時的。

是真的很實時(手動狗頭)。

不僅可以很好地區(qū)分發(fā)言人,根據(jù)不同發(fā)言人整理核心觀點,而且,用戶可以邊聽邊選中文段,自己劃重點。

邊開會邊做會議紀(jì)要,不是夢。

整個界面的右側(cè)板塊,是用來寫寫畫畫自個兒做筆記的部分。

當(dāng)錄音結(jié)束后,這一板塊會劃分成三個區(qū)域:

導(dǎo)讀:對錄音內(nèi)容進行AI總結(jié),包括摘要、章節(jié)速覽、待辦事項等;

腦圖:根據(jù)錄音內(nèi)容整理出思維導(dǎo)圖,幫助快速掌握會議要點和脈絡(luò);

筆記:顧名思義,是錄音過程中用戶自己記錄下的內(nèi)容。

關(guān)于實時記錄,最后來劃個重點:支持每天20小時的錄制撰寫時長,使用免費!還是免!費!

閱讀助手,功能等同于原來的通義智文。

上來就先告訴你,與實際記錄一樣,它同樣是免費的。

在閱讀助手,各種格式的文檔/論文/圖書,包括PDF(含掃描件)、word、圖片、HTML、Markdown、EPUB、Mobi,無論是網(wǎng)頁鏈接還是播客鏈接,都能被精準(zhǔn)速讀。

而且,超多格式伴隨著超大容量——

文檔,可以是長達(dá)1000萬字的;音頻視頻,可以是6小時起步的。

非常Nice。

上手測試過程中,我們喂給了它兩本書,分別是193頁、英文版的《我們賴以生存的隱喻》,和500頁、中文版的《埃隆·馬斯克傳》。

首先,很關(guān)鍵的一個功能是閱讀助手支持全文翻譯,翻譯速度還很快,幾乎不用等。

對經(jīng)常讀外文文獻(xiàn)的朋友們來說,真的非常友好。

其次,AI提煉出的導(dǎo)讀部分,也會翻譯成中文呈現(xiàn)。

這一部分由全文概述、關(guān)鍵要點、速度導(dǎo)覽等組成;如果丟給它的是論文,還會有論文速讀(核心要點總結(jié))、論文總結(jié)(文章優(yōu)點、方法創(chuàng)新點、未來展望),幫助用戶快速理解內(nèi)容。

如果嫌棄導(dǎo)讀還是太長?

沒關(guān)系,指路旁邊的腦圖,分分鐘厘清主要脈絡(luò)。

更有意思的是,在閱讀助手里,用戶能針對原文劃詞解讀,輔助理解關(guān)鍵點。

可以選擇在板塊底部的對話框,問出所有你不明白不理解的文檔相關(guān)問題。

這個功能約等于“讓死的論文活過來交流探討”。

如此這般,實時記錄、閱讀助手、PPT創(chuàng)作,形成了三合一的通義效率。

實時記錄功能能夠迅速捕捉并保存每一個重要信息;

閱讀助手則是輔助位,幫助在知識中篩選、提煉,讓用戶短時間內(nèi)掌握核心要義;

而PPT創(chuàng)作則能借用大模型的AI能力將散落的信息整理成富有邏輯性和視覺沖擊力的展示材料。

這三者相輔相成,共同構(gòu)成了一個從信息整理、閱讀理解到內(nèi)容創(chuàng)作的完整工作學(xué)習(xí)流程;每一步環(huán)環(huán)相扣,不管是面對工作還是學(xué)習(xí),都能事半功倍。

大模型應(yīng)用想卷,得靠技術(shù)和體驗

上面提到的三個功能,都可以在PC端絲滑使用。

多說一嘴,除了PPT創(chuàng)作,另外兩個功能還能在手機端體驗。

“我們希望通過這些工具幫助用戶節(jié)省時間,提升工作學(xué)習(xí)效率,激發(fā)無限創(chuàng)意。”通義效率產(chǎn)品經(jīng)理王曉明表示,未來圍繞工作學(xué)習(xí)場景,通義會持續(xù)幫用戶用AI技術(shù)提效。

通義效率背后,正是基于強大的通義大模型。

阿里旗下通義千問大模型聚焦開源路線,家族陣容龐大,是國內(nèi)的頭部梯隊玩家,在多個全球評測榜單上也常常名列前茅。

通義近期發(fā)布了全球性能最強的開源模型Qwen2-72B,該模型提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。多個國內(nèi)外榜單顯示,Qwen2-72B成為排名第一的中國大模型,也是全球最強的開源模型。

長期耕耘得來的技術(shù)優(yōu)勢,為通義效率提供了源源不斷的創(chuàng)新動力。

而三合一整合后推出的通義效率,精準(zhǔn)地圍繞工作學(xué)習(xí)流程,將信息整理、閱讀理解到內(nèi)容創(chuàng)作這三大功能進行了無縫打通,形成了一個高效的工作學(xué)習(xí)閉環(huán)。

這一閉環(huán)不僅能夠激發(fā)用戶的創(chuàng)意思維,還能夠顯著提升工作效率。

更為重要的是,通義效率率先將這些功能全部實現(xiàn)在PC端,真正做到了“需求在哪里,效率就在哪里發(fā)揮作用”。

這種以用戶需求為導(dǎo)向的設(shè)計理念,使得通義效率在提升用戶工作效率的同時,也極大地增強了用戶體驗。

當(dāng)然了,換個視角來看,通義上線“效率”的背后,其實反映了市場的選擇和趨勢——

大模型的應(yīng)用正在朝著智能化、個性化、一站式、高效率、少人工的方向發(fā)展。

這正是大模型在應(yīng)用層面的本質(zhì)體現(xiàn)。

隨著大模型日益融入大眾的日常生活,用戶在入門上手之后,追求的便是更加卓越的體驗。

如果技術(shù)不夠先進,體驗不夠優(yōu)秀,那么就容易被用戶和市場所拋棄。

因此,大模型的應(yīng)用落地和推廣,必須走向更實用、更好用的方向。

實際上,我們正在見證這一趨勢的發(fā)生,通義效率的選擇,就是最好的證明之一。

它告訴我們,應(yīng)用落地和推廣,只有真正滿足用戶需求,提供優(yōu)質(zhì)體驗的產(chǎn)品,才能在AI 2.0的模型與應(yīng)用大潮中站穩(wěn)腳跟。

AI
新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)

創(chuàng)事記

科學(xué)探索

科學(xué)大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數(shù)碼 新浪手機 科學(xué)探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產(chǎn)品新聞

新浪眾測

新酷產(chǎn)品第一時間免費試玩

新浪探索

提供最新的科學(xué)家新聞,精彩的震撼圖片