【華鑫計算機|行業周報】豆包大模型家族迎來全面升級,視覺理解模型邁入“厘時代”

【華鑫計算機|行業周報】豆包大模型家族迎來全面升級,視覺理解模型邁入“厘時代”
2024年12月26日 10:36 市場投研資訊

(來源:華鑫研究)

▌算力:恒源云13核+128G算力緊張,英偉達發布AI超級計算機Jetson Orin Nano Super

本周恒源云13核+128G算力緊張。具體來看,顯卡配置為A100-40G中,騰訊云16核+96G價格為28.64元/時,阿里云12核+94GiB價格為31.58元/時;顯卡配置為A100-80G中,恒源云13核+128G算力緊張;阿里云16核+125GiB價格為34.74元/時;顯卡配置為A800-80G中,恒源云16+256G價格為9.00元/時。

近日,英偉達推出了一款全新的尺寸小巧的生成式 AI 超級計算機NVIDIA Jetson Orin Nano Super,該開發者套件只有手掌大小,能夠為商業 AI 開發者、科技愛好者和學生等各類人群提供更強大的生成式 AI 功能與性能,目前建議零售價 2070 人民幣。Jetson Orin Nano Super 憑借其卓越性能,無論是創建基于檢索增強生成的 LLM 聊天機器人、構建視覺 AI 智能體,還是部署基于 AI 的機器人,均能得以有效實現。Jetson Orin Nano Super亮點如下:

具備顛覆性的生成式 AI 模型性能。NVIDIA 最新軟件更新將 Jetson Orin Nano 的 AI 性能從 40 TOPS 提升至 67 TOPS,并將內存帶寬從 68 GB/s 提升至 102 GB/s,使開發者能夠更高效地運行各種生成式 AI 模型。與上一代產品相比,NVIDIA Jetson Orin Nano Super的生成式 AI 推理性能提升至 1.7 倍,性能提升 70%,達到 67 INT8 TOPS,內存帶寬提高 50%,達到 102GB/s。NVIDIA Jetson Orin Nano Super 在各種熱門大語言模型 (LLM)、視覺語言模型 (VLM) 和視覺 Transformer 上的性能相比前代產品均有顯著提升。

助力解鎖更多AI場景應用。NVIDIA Jetson Orin Nano Super 可提供出色的 AI 計算能力、快速的內存帶寬和全面的軟件堆棧,為新的生成式 AI 應用提供卓越的能效,它支持任何基于 Transformer 的生成式 AI 模型的快速推理。在機器人領域,從開發到仿真再到部署,借助 AI 加速機器人開發,實現移動、抓取和視覺等關鍵功能,實現為各行各業構建機器人。在視覺領域,其搭載的NVIDIA Metropolis 集成了視覺數據和AI,可以處理適用于順暢零售、庫存管理、智慧城市交通、工廠檢查和醫療健康等應用的傳感器數據。

目前,NVIDIA Jetson Orin包含Jetson AGX Orin 、Jetson Orin NX和Jetson Orin Nano三款系列產品,可為開發者提供不同性能和價位的加速計算能力,從而滿足多種自主應用的需求。

▌ AI應用:豆包大模型家族全方位優化升級

2024年12月18日火山引擎FORCE原動力大會上,火山引擎展示了其全新升級的豆包大模型家族,包含豆包視覺理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音樂模型、文生圖模型等,為企業提供多模態大模型能力。豆包大模型于12月實現日均tokens使用量超過4萬億,較5月發布時期增長超過33倍,穩居行業領先地位。

視覺理解模型重磅發布。豆包視覺理解模型具備以下三種能力:更強的內容識別能力,可識別出圖像中的物體類別、形狀等基本要素以及理解物體之間的關系、空間布局以及場景的整體含義;更強的理解和推理能力,能根據所識別的文字和圖像信息進行復雜的邏輯計算;更細膩的視覺描述能力,可以基于圖像信息,更細膩地描述圖像呈現的內容以及多種文體創作。以上能力極大拓展了大模型的場景邊界,在金融、醫療、建筑、地理、體育、物流等諸多行業有著廣闊應用前景。除此之外,視覺理解的輸入價格為每千tokens 0.003元,比行業平均價格降低85%,相當于1元錢可以處理284張720P的圖片,具備高性價比優勢,視覺理解模型正式走進厘時代。同時火山引擎還將提供更高的初始流量,RPM達到15000次,TPM達到120萬,讓企業和開發者用好視覺理解模型,找到更多創新場景。

模型家族迎來全面升級。火山引擎除了推出視覺理解模型之外,還發布、升級了多個其他模型,大模型家族成員更豐富,大模型能力再提升。大會發布豆包3D生成模型,其與火山引擎數字孿生平臺veOmniverse結合使用,可以高效完成智能訓練、數據合成和數字資產制作,成為一套支持 AIGC 創作的物理世界仿真模擬器。此外,豆包通用模型pro全面升級,對齊GPT-4o,使用價格僅為后者的1/8;音樂模型從生成60秒的簡單結構,升級到生成3分鐘的完整作品;文生圖模型2.1版本在業界首次實現精準生成漢字和一句話P圖的產品化能力,該模型已接入即夢AI和豆包App。

AI 應用開發平臺全新升級。火山引擎升級了火山方舟、扣子和 HiAgent 三款平臺產品,幫助企業構建好自身的 AI 能力中心,高效開發 AI 應用。其中,火山方舟發布了大模型記憶方案,并推出 Prefix Cache 和 Session Cache API,降低延遲和成本。火山方舟還帶來全域 AI 搜索,具備場景化搜索推薦一體化、企業私域信息整合等服務。

技術架構面向AI全面轉型。云原生是過去十年最重要的計算范式,而火山引擎認為,未來十年計算范式應從云原生轉變為 AI 云原生。基于 AI 云原生的理念,火山引擎推出了新一代計算、網絡、存儲和和安全產品。在計算方面,火山引擎 GPU 實例,通過 vRDMA 網絡,支持大規模并行計算和 P/D 分離推理架構,顯著提升訓練和推理效率,降低成本;在存儲方面,新推出的 EIC 彈性極速緩存,能夠實現 GPU 直連,使大模型推理時延降低至 1/50、成本降低 20%;在安全方面,火山將推出 PCC 私密云服務,構建大模型的可信應用體系。基于 PCC,企業能夠實現用戶數據在云上推理的端到端加密,性能卓越。

火山引擎持續致力于增強模型能力、完善模型服務,促進 AI 在各行各業的深度融合與創新應用,打造更強性能、更低價格、更易落地的豆包大模型,開啟一個更加智能、高效、便捷的 AI 時代。

▌AI融資動向:Databricks/智譜AI獲本周AI融資市場估值前二,分獲100億美元/30億人民幣融資

本周,Databricks/智譜AI獲本周AI融資市場估值前二,分別獲100億美元/30億元人民幣融資。Databricks最初是美國加州大學伯克利AMP實驗室的Spark大數據處理系統商業化項目,可以幫助企業以極快的速度分析其內部大數據,也憑此在獲得了在硅谷立足之地。到2020年末,Databricks推出了其數據倉庫產品——Databricks SQL,憑借著對AI數據的理解,Databricks先后打造了Apache Spark、Delta Lake、MLflow和OneLakehousePlatform,開設了多條產品線。目前,Databricks主要靠開發軟件來提取、分析和構建人工智能應用程序,這些應用程序使用來自各種來源的復雜數據。商業模式方面,Databricks根據客戶每秒消耗的計算資源量收費,并打造了自家獨有的DBU作為衡量單位。從官網客戶資源庫可以看到,Databricks擁有移動通信公司AT&T、電子商品公司惠普、語言AI工具Grammarly等超過500多家客戶群體。

?智譜AI或受益于清華系的科研底色,一直保持著較快的迭代速度。2020年底,智譜AI研發GLM預訓練架構,2021年訓練完成百億參數模型GLM-10B,同年利用MoE架構成功訓練出收斂的萬億稀疏模型。2023年,智譜AI推出了千億基座的對話模型ChatGLM,并開源了單卡版模型ChatGLM-6B,使得研究者和個人開發者可以進行微調和部署。與此同時,智譜AI開放平臺的價格從2023年年初到2024年下半年降低了5000倍。2024年以來,智譜AI更是先后發布對標Sora的視頻生成模型CogVideoX,以及對標GPT-4o的端到端語音模型GLM-4-Voice和GLM-4-VideoCall。

▌投資建議

大模型或從快速擴張邁入淘汰賽階段,字節明年有望迎來爆款應用。今年以來,視覺理解模型在 GPT-4o、Google 的 Project Astra,以及 iPhone 16 和一眾旗艦機型上都加速落地。豆包視覺理解模型不僅能精準識別視覺內容,還可根據圖像信息進行復雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務。豆包視覺理解模型千tokens輸入價格僅為3厘,大模型的價格體系實現了從分至厘的跨越性調整,以更低成本讓多模態交互降低用戶的使用門檻,輔助完成一系列復雜的任務。人類接收的信息超過80%來自視覺,視覺理解將極大地拓展大模型的能力邊界,同時也會降低人們與大模型交互的門檻,為大模型解鎖更豐富的應用場景。同時,隨著爆款應用的誕生,算力需求預計大幅增加。

我們堅定持續看好AI軟硬件機會,建議關注以AI為核心的龍頭廠商科大訊飛(002230.SZ)、芯片技術有望創新突破的寒武紀(688256.SH)、高速通信連接器業務或顯著受益于 GB200 放量的鼎通科技(688668.SH)、已與Rokid等多家知名AI眼鏡廠商建立緊密合作的億道信息(001314.SZ)等。

▌ 風險提示

?1)AI 底層技術迭代速度不及預期。2)政策監管及版權風險。3)AI 應用落地效果不及預期。4)推薦公司業績不及預期風險。

算力動態:恒源云13核+128G算力緊張,英偉達發布AI超級計算機Jetson Orin Nano Super

1.1

數據跟蹤:算力租賃價格平穩

本周恒源云13核+128G算力緊張。具體來看,顯卡配置為A100-40G中,騰訊云16核+96G價格為28.64元/時,阿里云12核+94GiB價格為31.58元/時;顯卡配置為A100-80G中,恒源云13核+128G算力緊張;阿里云16核+125GiB價格為34.74元/時;顯卡配置為A800-80G中,恒源云16+256G價格為9.00元/時。

1.2

產業動態:Jetson Orin Nano Super蘊含超強 AI 性能,

解鎖多元場景應用新篇

近日,英偉達推出了一款全新的尺寸小巧的生成式 AI 超級計算機NVIDIA Jetson Orin Nano Super,該開發者套件只有手掌大小,能夠為商業 AI 開發者、科技愛好者和學生等各類人群提供更強大的生成式 AI 功能與性能,目前建議零售價 2070 人民幣。Jetson Orin Nano Super 憑借其卓越性能,無論是創建基于檢索增強生成的 LLM 聊天機器人、構建視覺 AI 智能體,還是部署基于 AI 的機器人,均能得以有效實現。Jetson Orin Nano Super亮點如下:

具備顛覆性的生成式 AI 模型性能。NVIDIA 最新軟件更新將 Jetson Orin Nano 的 AI 性能從 40 TOPS 提升至 67 TOPS,并將內存帶寬從 68 GB/s 提升至 102 GB/s,使開發者能夠更高效地運行各種生成式 AI 模型。與上一代產品相比,NVIDIA Jetson Orin Nano Super的生成式 AI 推理性能提升至 1.7 倍,性能提升 70%,達到 67 INT8 TOPS,內存帶寬提高了 50%,達到 102GB/s。NVIDIA Jetson Orin Nano Super 在各種熱門大語言模型 (LLM)、視覺語言模型 (VLM) 和視覺 Transformer 上的性能相比前代產品均有顯著提升。

助力解鎖更多AI場景應用。NVIDIA Jetson Orin Nano Super 可提供出色的 AI 計算能力、快速的內存帶寬和全面的軟件堆棧,為新的生成式 AI 應用提供卓越的能效,它支持任何基于 Transformer 的生成式 AI 模型的快速推理。在機器人領域,從開發到仿真再到部署,借助 AI 加速機器人開發,實現移動、抓取和視覺等關鍵功能,實現為各行各業構建機器人。在視覺領域,其搭載的NVIDIA Metropolis 集成了視覺數據和AI,可以處理適用于順暢零售、庫存管理、智慧城市交通、工廠檢查和醫療健康等應用的傳感器數據。

目前,NVIDIA Jetson Orin包含Jetson AGX Orin 、Jetson Orin NX和Jetson Orin Nano三款系列產品,可為開發者提供不同性能和價位的加速計算能力,從而滿足多種自主應用的需求。

AI應用動態:Character.AI搜索訪問量環比+7.07%, 豆包大模型家族全方位優化

2.1

流量跟蹤:Character.AI搜索訪問量環比+7.07%?

本期(2024.12.16-2024.12.20)AI相關網站流量數據:訪問量前三位分別為ChatGPT(878.4M)、Bing(404.7M)和Canva(171.6M),訪問量環比增速第一為Character.AI(7.07%);平均停留時長前三位分別為Character.AI(00:13:14)、Discord(00:12:12)和Deepl(00:08:49);平均停留時長環比增速第一為文心一言(2.27%)。

2.2

產業動態:豆包大模型家族全方位優化

2024年12月18日火山引擎FORCE原動力大會上,火山引擎展示了其全新升級的豆包大模型家族,包含豆包視覺理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音樂模型、文生圖模型等,為企業提供多模態大模型能力。豆包大模型于12月實現日均tokens使用量超過4萬億,較5月發布時期增長超過33倍,穩居行業領先地位。

視覺理解模型重磅發布。視覺理解模型具備以下三種能力:更強的內容識別能力,可識別出圖像中的物體類別、形狀等基本要素以及理解物體之間的關系、空間布局以及場景的整體含義;更強的理解和推理能力,能根據所識別的文字和圖像信息進行復雜的邏輯計算;更細膩的視覺描述能力,可以基于圖像信息,更細膩地描述圖像呈現的內容以及多種文體創作。以上能力極大拓展了大模型的場景邊界,在金融、醫療、建筑、地理、體育、物流等諸多行業有著廣闊應用前景。除此之外,視覺理解的輸入價格為每千tokens 0.003元,比行業平均價格降低85%,相當于1元錢可以處理284張720P的圖片,具備高性價比優勢,視覺理解模型正式走進厘時代。同時火山引擎還將提供更高的初始流量,RPM達到15000次,TPM達到120萬,讓企業和開發者用好視覺理解模型,找到更多創新場景

模型家族迎來全面升級。火山引擎除了推出視覺理解模型之外,還發布、升級了多個其他模型,大模型家族成員更豐富,大模型能力再提升。大會發布豆包3D生成模型,其與火山引擎數字孿生平臺veOmniverse結合使用,可以高效完成智能訓練、數據合成和數字資產制作,成為一套支持 AIGC 創作的物理世界仿真模擬器。此外,豆包通用模型pro全面升級,對齊GPT-4o,使用價格僅為后者的1/8;音樂模型從生成60秒的簡單結構,升級到生成3分鐘的完整作品;文生圖模型2.1版本在業界首次實現精準生成漢字和一句話P圖的產品化能力,該模型已接入即夢AI和豆包App。

AI 應用開發平臺全新升級。火山引擎升級了火山方舟、扣子和 HiAgent 三款平臺產品,幫助企業構建好自身的 AI 能力中心,高效開發 AI 應用。其中,火山方舟發布了大模型記憶方案,并推出 Prefix Cache 和 Session Cache API,降低延遲和成本。火山方舟還帶來全域 AI 搜索,具備場景化搜索推薦一體化、企業私域信息整合等服務。

技術架構面向AI全面轉型。云原生是過去十年最重要的計算范式,而火山引擎認為,未來十年計算范式應從云原生轉變為 AI 云原生。基于 AI 云原生理念,火山引擎推出了新一代計算、網絡、存儲和和安全產品。在計算層面,火山引擎 GPU 實例,通過 vRDMA 網絡,支持大規模并行計算和 P/D 分離推理架構,顯著提升訓練和推理效率,降低成本;在存儲方面,新推出的 EIC 彈性極速緩存,能夠實現 GPU 直連,使大模型推理時延降低至 1/50、成本降低 20%;在安全方面,火山將推出 PCC 私密云服務,構建大模型的可信應用體系。基于 PCC,企業能夠實現用戶數據在云上推理的端到端加密,性能卓越。

火山引擎持續致力于增強模型能力、完善模型服務,促進 AI 在各行各業的深度融合與創新應用,打造更強性能、更低價格、更易落地的豆包大模型,有望開啟一個更加智能、高效、便捷的 AI 時代。

AI融資動向:Databricks/智譜AI獲本周AI融資市場估值前二,分獲100億美元/30億人民幣融資

本周,Databricks/智譜AI獲本周AI融資市場估值前二,分別獲100億美元/30億元人民幣融資。Databricks最初是美國加州大學伯克利AMP實驗室的Spark大數據處理系統商業化項目,可以幫助企業以極快的速度分析其內部大數據,也憑此在獲得了在硅谷立足之地。到2020年末,Databricks推出了其數據倉庫產品——Databricks SQL,憑借著對AI數據的理解,Databricks先后打造了Apache Spark、Delta Lake、MLflow和OneLakehousePlatform,開設了多條產品線。目前,Databricks主要靠開發軟件來提取、分析和構建人工智能應用程序,這些應用程序使用來自各種來源的復雜數據。商業模式方面,Databricks根據客戶每秒消耗的計算資源量收費,并打造了自家獨有的DBU作為衡量單位。從官網客戶資源庫可以看到,Databricks擁有移動通信公司AT&T、電子商品公司惠普、語言AI工具Grammarly等超過500多家客戶群體。

?智譜AI或受益于清華系的科研底色,一直保持著較快的迭代速度。2020年底,智譜AI研發GLM預訓練架構,2021年訓練完成百億參數模型GLM-10B,同年利用MoE架構成功訓練出收斂的萬億稀疏模型。2023年,智譜AI推出了千億基座的對話模型ChatGLM,并開源了單卡版模型ChatGLM-6B,使得研究者和個人開發者可以進行微調和部署。與此同時,智譜AI開放平臺的價格從2023年年初到2024年下半年降低了5000倍。2024年以來,智譜AI更是先后發布對標Sora的視頻生成模型CogVideoX,以及對標GPT-4o的端到端語音模型GLM-4-Voice和GLM-4-VideoCall。

行情復盤

本周,AI算力指數/AI應用指數/萬得全A/中證紅利日漲幅最大值分別為4.75%/2.13%/0.63%/0.84%,日跌幅最大值分別為-2.85%/-3.27%/-1.31%/-0.96%。AI算力指數內部,佳力圖以+36.27%錄得本周最大漲幅,天娛數科以-14.82%錄得本周最大跌幅。AI應用指數內部,光云科技以+35.48%得本周最大漲幅,實豐文化以-22.16%錄得本周最大跌幅。

投資建議

大模型或從快速擴張邁入淘汰賽階段,字節明年有望迎來爆款應用。今年以來,視覺理解模型在 GPT-4o、Google 的 Project Astra,以及 iPhone 16 和一眾旗艦機型上都加速落地。豆包視覺理解模型不僅能精準識別視覺內容,還可根據圖像信息進行復雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務。豆包視覺理解模型千tokens輸入價格僅為3厘,大模型的價格體系實現了從分至厘的跨越性調整,以更低成本讓多模態交互降低用戶的使用門檻,輔助完成一系列復雜的任務。人類接收的信息超過80%來自視覺,視覺理解將極大地拓展大模型的能力邊界,同時也會降低人們與大模型交互的門檻,為大模型解鎖更豐富的應用場景。同時,隨著爆款應用的誕生,算力需求預計大幅增加。

我們堅定持續看好AI軟硬件機會,建議關注以AI為核心的龍頭廠商科大訊飛(002230.SZ)、芯片技術有望創新突破的寒武紀(688256.SH)、高速通信連接器業務或顯著受益于 GB200 放量的鼎通科技(688668.SH)、已與Rokid等多家知名AI眼鏡廠商建立緊密合作的億道信息(001314.SZ)等。

1)AI 底層技術迭代速度不及預期。2)政策監管及版權風險。3)AI 應用落地效果不及預期。4)推薦公司業績不及預期風險。

證券研究報告:《豆包大模型家族迎來全面升級,視覺理解模型邁入“厘時代”—計算機行業周報》

對外發布時間:2024年12月22日

發布機構:華鑫證券

本報告分析師:

寶幼琛? SAC編號:S1050521110002

計算機&中小盤組介紹

寶幼琛:本碩畢業于上海交通大學,多次新財富、水晶球最佳分析師團隊成員,7年證券從業經驗,2021年11月加盟華鑫證券研究所,目前主要負責計算機與中小盤行業上市公司研究。擅長領域包括:云計算、網絡安全、人工智能、區塊鏈等。

任春陽:華東師范大學經濟學碩士,6年證券行業經驗,2021年11月加盟華鑫證券研究所,從事計算機與中小盤行業上市公司研究

周文龍:澳大利亞莫納什大學金融碩士

陶欣怡:畢業于上海交通大學,于2023年10月加入團隊。

本報告署名分析師具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,以勤勉的職業態度,獨立、客觀地出具本報告。本報告清晰準確地反映了本人的研究觀點。本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。

法律聲明

海量資訊、精準解讀,盡在新浪財經APP

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 01-06 思看科技 688583 --
  • 01-06 惠通科技 301601 --
  • 12-30 鈞崴電子 301458 --
  • 12-30 賽分科技 688758 --
  • 12-24 星圖測控 920116 6.92
  • 新浪首頁 語音播報 相關新聞 返回頂部