這年頭,哪有人上班不發(fā)瘋的(doge)。
就拿PPT來說,趙曉卉“PPTSD”這詞兒一出,那真是戳到了打工人心坎上。
對啊,PPT是什么高貴的東西啊!都大模型時代了,就沒有哪個AI能又好又快地幫我搞定這事兒嗎!
還真別說,打工人是會心疼打工人的。就在編輯們孜孜不倦尋找解放雙手的大模型工具的日常中,誒嘿,最近還真又挖到了新神器——
通義直接在網(wǎng)頁版里上新了“效率”版塊,功能很直給:實時記錄、閱讀助手,還有PPT創(chuàng)作。
其中,PPT創(chuàng)作屬于是新鮮出爐。
簡單來說,主打一個功能是大模型給的,但并沒多大“AI味”。
最關(guān)鍵的是,免費。
這咱不得抓緊測試一波——
拒絕PPTSD
具體來說,通義PPT創(chuàng)作主要提供了兩種PPT制作方式。
一句話主題生成PPT:
如果你啥思路沒有,只有一句話主題,那么可以把主題當(dāng)成Prompt直接扔給大模型。
當(dāng)然,如果你已經(jīng)有完整的思路大綱,它也支持最多10萬字的超長文本輸入。
上傳文件生成PPT:
文檔、音視頻文件都支持。
那么就,先給又菜又愛玩的手殘黨同事們,搞一份《黑神話:悟空》攻略(PPT版)吧。
提示詞很簡短,就是:《黑神話:悟空》游戲攻略。
一份像模像樣的PPT大綱秒速生成:
哪里看不順眼可以上手修改,懶人黨也可以直接下一步——選模板。
在不提供任何背景資料的情況下,通義生成的PPT能達(dá)到什么樣的效果?
點擊“生成PPT”,等待不到1分鐘,答案即刻揭曉。
應(yīng)該是基于通義大模型的聯(lián)網(wǎng)搜索能力,生成的游戲介紹里,《黑神話》的制作方、游戲引擎等重點信息都沒出錯。
不過大模型本身看上去并沒有被“劇透”,在具體游戲內(nèi)容上,有點腦洞大開。
但話術(shù)組織,設(shè)計排版,還真可圈可點。
單看這文案,確實沒什么AI味兒,說得上是言之有物。
人機協(xié)作修改起來也很方便:
點擊文本框既能直接修改文字,也可以一鍵召喚大模型幫忙一起優(yōu)化文案。
配圖同樣可以交給AI生成。
不會寫提示詞也沒關(guān)系,通義PPT內(nèi)置“咒語書”,點擊即用,也可以作為參考。
看樣子,日常用來糊弄老板妥妥夠用了(不是)。
上傳文件生成PPT
咳咳,還是回到正經(jīng)用途上,如果喂給通義PPT更詳細(xì)的文檔資料,它又會表現(xiàn)如何?
比如,投喂一份內(nèi)部培訓(xùn)資料,讓通義PPT來幫忙搞定培訓(xùn)PPT。
效果上be like:媽媽再也不用擔(dān)心我開會前做不完P(guān)PT。
PPT生成的內(nèi)容和上傳文件關(guān)聯(lián)性很高,基本上把文檔重點都劃出來了,直接拿來用問題也不大。
簡單總結(jié)一下,通義這波上新的PPT創(chuàng)作,具有以下幾個優(yōu)點:
言之有物:做到了生成文本更像人話(去AI味),并且不是片湯話,能結(jié)合用戶需求和上傳文件輸出有信息量的PPT內(nèi)容。
模板豐富:提供了各個不同場景、行業(yè)適用的PPT模板,設(shè)計美觀,大學(xué)生到上班族都能用。
智能編排:提供了全流程智能編排的能力,可在線實時調(diào)整PPT模板編排、PPT配圖智能生成、PPT文本智能改寫等。
進一步扒拉了一下,通義PPT背后的基礎(chǔ)模型是通義千問大模型2.5,相比上一版本,Qwen 2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,性能超越GPT-4 Turbo。
在對長文檔的支持方面,通義PPT支持1000萬字長文檔,包括PPT、PDF和網(wǎng)頁。
多模態(tài)方面,支持上傳最長6小時的音頻、視頻,也可以輸入鏈接導(dǎo)入線上音視頻。
文生圖功能,則是引入了通義萬相的能力。
三合一“通義效率”
值得一提的是,與PPT創(chuàng)作共同存在于通義效率版塊的,還有另外兩個功能:
實時記錄,以及閱讀助手。
不說不知道,這兩者其實都是通義用戶的老朋友。
實時記錄,原通義聽悟,是音視頻內(nèi)容方面的AI助手。
應(yīng)用場景聚焦課堂記錄、會議記錄,能完成的工作,包括語音轉(zhuǎn)文字、發(fā)言人區(qū)分、智能總結(jié)等。
界面非常簡潔,選擇語言(能識別中、英、日三種語言),確定需不需要實時翻譯成中文,即可開始在線錄音。
外教課or國際會議,不用愁了。
在通義實時記錄,錄音是實時的,語音轉(zhuǎn)文字是實時的,英文/日語錄音轉(zhuǎn)譯成中文是實時的。
連邊轉(zhuǎn)文字邊修正錯別字,也是實時的。
是真的很實時(手動狗頭)。
不僅可以很好地區(qū)分發(fā)言人,根據(jù)不同發(fā)言人整理核心觀點,而且,用戶可以邊聽邊選中文段,自己劃重點。
邊開會邊做會議紀(jì)要,不是夢。
整個界面的右側(cè)板塊,是用來寫寫畫畫自個兒做筆記的部分。
當(dāng)錄音結(jié)束后,這一板塊會劃分成三個區(qū)域:
導(dǎo)讀:對錄音內(nèi)容進行AI總結(jié),包括摘要、章節(jié)速覽、待辦事項等;
腦圖:根據(jù)錄音內(nèi)容整理出思維導(dǎo)圖,幫助快速掌握會議要點和脈絡(luò);
筆記:顧名思義,是錄音過程中用戶自己記錄下的內(nèi)容。
關(guān)于實時記錄,最后來劃個重點:支持每天20小時的錄制撰寫時長,使用免費!還是免!費!
閱讀助手,功能等同于原來的通義智文。
上來就先告訴你,與實際記錄一樣,它同樣是免費的。
在閱讀助手,各種格式的文檔/論文/圖書,包括PDF(含掃描件)、word、圖片、HTML、Markdown、EPUB、Mobi,無論是網(wǎng)頁鏈接還是播客鏈接,都能被精準(zhǔn)速讀。
而且,超多格式伴隨著超大容量——
文檔,可以是長達(dá)1000萬字的;音頻視頻,可以是6小時起步的。
非常Nice。
上手測試過程中,我們喂給了它兩本書,分別是193頁、英文版的《我們賴以生存的隱喻》,和500頁、中文版的《埃隆·馬斯克傳》。
首先,很關(guān)鍵的一個功能是閱讀助手支持全文翻譯,翻譯速度還很快,幾乎不用等。
對經(jīng)常讀外文文獻(xiàn)的朋友們來說,真的非常友好。
其次,AI提煉出的導(dǎo)讀部分,也會翻譯成中文呈現(xiàn)。
這一部分由全文概述、關(guān)鍵要點、速度導(dǎo)覽等組成;如果丟給它的是論文,還會有論文速讀(核心要點總結(jié))、論文總結(jié)(文章優(yōu)點、方法創(chuàng)新點、未來展望),幫助用戶快速理解內(nèi)容。
如果嫌棄導(dǎo)讀還是太長?
沒關(guān)系,指路旁邊的腦圖,分分鐘厘清主要脈絡(luò)。
更有意思的是,在閱讀助手里,用戶能針對原文劃詞解讀,輔助理解關(guān)鍵點。
可以選擇在板塊底部的對話框,問出所有你不明白不理解的文檔相關(guān)問題。
這個功能約等于“讓死的論文活過來交流探討”。
如此這般,實時記錄、閱讀助手、PPT創(chuàng)作,形成了三合一的通義效率。
實時記錄功能能夠迅速捕捉并保存每一個重要信息;
閱讀助手則是輔助位,幫助在知識中篩選、提煉,讓用戶短時間內(nèi)掌握核心要義;
而PPT創(chuàng)作則能借用大模型的AI能力將散落的信息整理成富有邏輯性和視覺沖擊力的展示材料。
這三者相輔相成,共同構(gòu)成了一個從信息整理、閱讀理解到內(nèi)容創(chuàng)作的完整工作學(xué)習(xí)流程;每一步環(huán)環(huán)相扣,不管是面對工作還是學(xué)習(xí),都能事半功倍。
大模型應(yīng)用想卷,得靠技術(shù)和體驗
上面提到的三個功能,都可以在PC端絲滑使用。
多說一嘴,除了PPT創(chuàng)作,另外兩個功能還能在手機端體驗。
“我們希望通過這些工具幫助用戶節(jié)省時間,提升工作學(xué)習(xí)效率,激發(fā)無限創(chuàng)意。”通義效率產(chǎn)品經(jīng)理王曉明表示,未來圍繞工作學(xué)習(xí)場景,通義會持續(xù)幫用戶用AI技術(shù)提效。
通義效率背后,正是基于強大的通義大模型。
阿里旗下通義千問大模型聚焦開源路線,家族陣容龐大,是國內(nèi)的頭部梯隊玩家,在多個全球評測榜單上也常常名列前茅。
通義近期發(fā)布了全球性能最強的開源模型Qwen2-72B,該模型提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。多個國內(nèi)外榜單顯示,Qwen2-72B成為排名第一的中國大模型,也是全球最強的開源模型。
長期耕耘得來的技術(shù)優(yōu)勢,為通義效率提供了源源不斷的創(chuàng)新動力。
而三合一整合后推出的通義效率,精準(zhǔn)地圍繞工作學(xué)習(xí)流程,將信息整理、閱讀理解到內(nèi)容創(chuàng)作這三大功能進行了無縫打通,形成了一個高效的工作學(xué)習(xí)閉環(huán)。
這一閉環(huán)不僅能夠激發(fā)用戶的創(chuàng)意思維,還能夠顯著提升工作效率。
更為重要的是,通義效率率先將這些功能全部實現(xiàn)在PC端,真正做到了“需求在哪里,效率就在哪里發(fā)揮作用”。
這種以用戶需求為導(dǎo)向的設(shè)計理念,使得通義效率在提升用戶工作效率的同時,也極大地增強了用戶體驗。
當(dāng)然了,換個視角來看,通義上線“效率”的背后,其實反映了市場的選擇和趨勢——
大模型的應(yīng)用正在朝著智能化、個性化、一站式、高效率、少人工的方向發(fā)展。
這正是大模型在應(yīng)用層面的本質(zhì)體現(xiàn)。
隨著大模型日益融入大眾的日常生活,用戶在入門上手之后,追求的便是更加卓越的體驗。
如果技術(shù)不夠先進,體驗不夠優(yōu)秀,那么就容易被用戶和市場所拋棄。
因此,大模型的應(yīng)用落地和推廣,必須走向更實用、更好用的方向。
實際上,我們正在見證這一趨勢的發(fā)生,通義效率的選擇,就是最好的證明之一。
它告訴我們,應(yīng)用落地和推廣,只有真正滿足用戶需求,提供優(yōu)質(zhì)體驗的產(chǎn)品,才能在AI 2.0的模型與應(yīng)用大潮中站穩(wěn)腳跟。
“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)