NVIDIA Nemotron 3 Ultra icon

NVIDIA Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra 是一款開放式 550B 參數 Mixture-of-Experts 模型,適合長流程 agent 工作,支援推理、上下文保留與多輪高效工具使用;提供開放權重、recipes 與微調支援。

NVIDIA Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra 是什麼?

NVIDIA Nemotron 3 Ultra 是一款開放式 550B 參數 Mixture-of-Experts 模型,具備 55B 活躍參數,專為長流程 agent 工作而設計。它定位於需要持續推理、工具使用、上下文保留,以及在多輪互動中高效執行的 agent 協調任務。

此模型旨在協助開發者將 agent 系統拆分為不同工作層:用前沿推理處理複雜規劃,並以更高效率的方式執行大量呼叫、驗證與工具使用。NVIDIA 表示,Nemotron 3 Ultra 結合了長上下文處理、更快推理與開放訓練 recipes 的架構改進,讓團隊能針對特定領域需求進行調整與微調。

主要功能

  • 550B 參數 Mixture-of-Experts 架構、55B 活躍參數,讓模型具備大容量,同時每個 token 只使用部分參數。
  • 為 agent 協調而建,包括規劃、長流程推理,以及跨多輪處理重複的工具呼叫。
  • Hybrid Mamba-Transformer 層可更有效處理長上下文,適合需要保留並使用延伸對話或任務歷史的 agent。
  • 支援 NVFP4 量化,可跨架構 GPU 部署;NVIDIA 表示,其吞吐量最高可比同級其他開放模型高 5 倍。
  • LatentMoE 專家路由與 multi-token prediction,可提升多輪任務中的生成效率。
  • Multi-Teacher On-Policy Distillation 使用來自十多個領域專用 teacher model 的回饋,支援專精化與持續改進。
  • 開放權重、開放 recipes 與授權設計,讓模型更容易採用、評估與微調。

如何使用 NVIDIA Nemotron 3 Ultra

團隊通常會將 Nemotron 3 Ultra 作為 agent 系統中的推理層,尤其適合需要長期規劃或仔細彙整資訊的任務。實務上,可搭配較小且高效率的模型處理例行工具呼叫、檢索步驟、驗證或其他大量操作。

開始使用時,開發者會先在需要自動化的工作流程上評估它,若使用情境需要特殊行為,再透過微調或領域專屬訓練加以調整。由於 NVIDIA 強調開放權重與 recipes,這款模型的目標是滿足希望在自有基礎架構與 agent 管線中進行檢視、調整與部署的團隊。

使用案例

  • 協調需要在長時間開發過程中保留架構決策的程式設計 agent。
  • 將來自多個研究來源的矛盾證據彙整成單一路徑的推理過程或答案。
  • 驗證複雜限制,例如晶片設計需求或其他具多重相依性的技術系統。
  • 執行長流程企業工作,重複規劃、工具使用與驗證可能增加 token 成本與延遲。
  • 支援領域專屬的 agent 行為,讓開發者使用透明的訓練 recipes 對開放模型進行微調。

常見問題

Nemotron 3 Ultra 是聊天機器人模型還是 agent 模型?
它被定位為適用於長流程 agent 工作的開放模型,而非單純的單輪聊天機器人。

它和較小的高效率模型有什麼不同?
來源將它定位為較困難呼叫的推理與協調層,而較小模型則可處理例行執行、驗證與工具呼叫。

NVIDIA 有說明長上下文支援嗎?
有。文章強調 hybrid Mamba-Transformer 層與長上下文基準結果,顯示其重點在於延伸工作流程處理。

團隊可以針對自家領域調整模型嗎?
來源指出,它提供開放 recipes、權重與授權,旨在支援採用與微調。

宣稱的部署效能是什麼?
NVIDIA 表示,其吞吐量最高可比同級其他開放模型高 5 倍,且 NVFP4 可支援跨架構 GPU 部署。

替代方案

  • 其他大型開放式 Mixture-of-Experts 推理模型:當主要需求是高容量推理與開放模型存取時,它們相近,但各自的訓練方法與吞吐量不同。
  • 較小型、適合工具使用與驗證的高效率模型:它們更適合高量執行任務,但並非定位為處理困難推理的主要編排層。
  • 專有前沿推理模型:它們可能提供強大的規劃與回答品質,但在權重、recipes 或微調流程的開放性上,未必相同。
  • 通用型長上下文語言模型:它們可處理較長輸入,但可能並未特別針對 agent 編排、MoE 路由,或此處所述的吞吐量特性進行最佳化。