國泰君安證券:OpenAI提升用戶體驗 o3模型創新突破

國泰君安證券:OpenAI提升用戶體驗 o3模型創新突破
2024年12月28日 08:46 東方財富網

投資建議:OpenAI 12 days發布會最后四天發布了o1 API、o3等最新功能。o1模型通過增強API功能(如函數調用、結構化輸出和視覺輸入),大幅提升了開發者的效率和應用場景的多樣性;o3系列模型則在編碼、數學和科學推理等領域展現出接近或超越人類專家的能力,同時通過靈活的推理強度設置,顯著降低了使用成本。重點關注以下賽道:AI開發工具與平臺(如API服務和SDK支持);AI推理與高性能計算,以及AI安全對齊技術產品。這些領域或將受益于OpenAI的技術突破而得到更多發展機遇。

OpenAI通過發布o1模型,顯著增強了API功能。新功能包括函數調用、結構化輸出和視覺輸入,極大地提升了開發者的工作效率。o1模型在結構化輸出調用中的準確率達95%,遠超GPT-4o模型,確保了復雜任務中的高準確性和穩定性。此外,開發者消息和推理努力程度的控制選項,幫助開發者在性能與成本之間找到最佳平衡,進一步優化了開發體驗。視覺輸入功能的加入,使得o1模型能夠直接處理圖像輸入,如分析表格中的錯誤,進一步擴展了其應用場景。

ChatGPT桌面應用的原生化與深度集成大幅提升了編程與創作效率。用戶可通過快捷鍵快速調用ChatGPT,在Xcode和Warp終端生成復雜代碼片段,顯著縮短開發時間,提升代碼質量。與Notion、Apple Notes等創作工具的集成,進一步提升了文檔編輯和信息整合的效率,使得ChatGPT更加深入用戶的日常工作和創作流程。高級語音模式的引入,增強了用戶與ChatGPT的互動體驗,為用戶帶來了更高的便利性和生產力。

OpenAI推出的o3系列模型在性能、成本和安全性上取得突破。o3在ARC AGI基準測試中得分達到87.5%,超越人類平均水平,顯著提升了編碼、數學和科學問題解決能力。在Codeforces競技編程中,o3的ELO值接近2727,遠超o1模型的1891;在Epoch AI的Frontier Math Benchmark中準確率超過25%,這是目前最難的數學基準測試之一,此前所有現有模型的準確率均低于2%。o3 mini通過靈活的推理強度設置(低、中、高),在低推理強度下編碼能力已超越o1 mini,中等推理強度下性能優于o1,為開發者在使用成本和推理性能之間提供了平衡的選項。o3 mini在低推理強度下的延遲已接近GPT 4o的水平,而成本僅為o1模型的一小部分,為大規模商業化應用提供了堅實基礎。此外,OpenAI首次開放o3系列模型給外部研究人員進行安全測試,增強了公眾對技術的信任,進一步鞏固了OpenAI在AI領域的領先地位。

風險提示:技術突破存在安全與隱私風險;商業化進程不及預期。

海量資訊、精準解讀,盡在新浪財經APP

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 01-06 思看科技 688583 --
  • 01-06 惠通科技 301601 --
  • 12-30 鈞崴電子 301458 10.4
  • 12-30 賽分科技 688758 4.32
  • 12-24 星圖測控 920116 6.92
  • 新浪首頁 語音播報 相關新聞 返回頂部