Mercury 2

Mercury 2 是 Inception 的 diffusion 推理語言模型，適用於需要低延遲、OpenAI API 相容性與結構化輸出的生產 AI 工作流程，特別適合程式開發、agent、語音與檢索密集應用。

大型語言模型

AI內容生成器

AI回覆產生器

訪問網站

Mercury 2 是什麼

Mercury 2 是 Inception 速度最快的推理語言模型，建立於 diffusion 而非自回歸解碼之上。它被定位為一款以生產為導向的 LLM，適合需要在嚴格延遲預算內取得推理級品質的團隊。

這項產品鎖定的是延遲會在多步驟中累積的工作流程，例如程式助理、agentic 迴圈、語音介面與檢索管線。Inception 表示 Mercury 2 現已可透過其 API 與聊天體驗使用，且相容 OpenAI API，方便在既有技術堆疊中更容易導入。

主要功能

基於 diffusion 的推理

Mercury 2 採用基於 diffusion 的生成，而非由左至右的 token 解碼，並在少量步驟中平行細化輸出。

高吞吐量生成

模型頁面將 Mercury 2 描述為在商用 NVIDIA GPU 上可達每秒 1,000+ tokens，而發表文章則引用 NVIDIA Blackwell GPU 上每秒 1,009 tokens。

可直接套用的 API 相容性

該模型被定位為相容 OpenAI API，並可作為既有 LLM 工作流程的直接替代方案。

面向生產環境的輸出控制

Inception 列出可調式推理、128K 上下文視窗、原生工具使用，以及適用於生產流程的 schema 對齊 JSON 輸出。

以延遲為核心的設計

發表文章指出，Mercury 2 的設計目標是在高並發下維持 p95 延遲、逐輪行為與吞吐量穩定。

通用推理模型

Inception 將 Mercury 2 定位為其最強大的模型，適合兼顧效能與速度的複雜應用。

Mercury 2 的適用場景

程式撰寫與編輯
對於自動完成、下一步編輯建議、重構與互動式程式代理，Mercury 2 的定位是提供足夠即時的回應，讓建議能跟上開發者的工作節奏。
Agentic 迴圈
對於會串接許多推理呼叫的工作流程，例如 subagents 或活動最佳化，較低的單次呼叫延遲會影響可實際執行的步驟數。
即時語音與互動
對於語音介面與即時對話系統，Inception 將 Mercury 2 視為讓文字生成與自然語速節奏保持一致的一種方式。
搜尋與 RAG 管線
對於多跳檢索、重排序與摘要管線，Mercury 2 可在不讓端到端延遲超出實用範圍的前提下加入推理能力。

Pros and Cons

Pros

專為即時或近即時應用設計，適合在每個步驟都重視延遲的情境。
採用基於 diffusion 的生成，能一次平行產生多個 tokens，而非序列式解碼。
支援可調式推理、工具使用、結構化 JSON 輸出與 128K 上下文視窗。
定位為相容 OpenAI API，可降低既有團隊的遷移成本。
有文件化的使用案例，涵蓋程式開發、agent、語音與搜尋工作流程。

Cons

公開定價頁無法存取，因此除了來源頁提及的定價資訊外，方案細節並未完整文件化。
來源資料未提供正式的整合目錄或部署矩陣。

FAQ

團隊要如何使用 Mercury 2？

Mercury 2 現可透過 Inception 的 API 與聊天介面使用。網站也表示它相容 OpenAI API，因此可直接嵌入既有技術堆疊而無需重寫。

Mercury 2 最適合用於哪些情境？

Inception 將 Mercury 2 定位為適合低延遲工作的模型，例如程式撰寫與編輯、agent 工作流程、即時語音與互動，以及搜尋或 RAG 管線。

產品頁描述了哪些功能？

產品頁列出可調式推理、128K 上下文視窗、原生工具使用，以及與 schema 對齊的 JSON 輸出。它也強調透過基於 diffusion 的平行細化來加速生成。

網站上顯示了哪些定價選項？

網站上的定價頁目前無法存取，但模型頁顯示 Free、Developer 與 Enterprise 三種使用途徑。Free 包含所有模型的存取權與 1000 萬個免費 tokens；Developer 採用按用量計費；Enterprise 則提供自訂速率限制、SLA 保證、安全與隱私，以及依量計價。

有哪些已文件化的整合？

來源資料沒有列出正式的整合目錄。不過資料指出 Mercury 2 相容 OpenAI API，並可透過包括 AISuite、LiteLLM 與 LangChain 在內的函式庫支援。

Quick Facts

Category: AI 模型 / 開發者工具
Product: Mercury 2
Company: Inception
Platform: API 與聊天
Compatibility: 相容 OpenAI API
Context window: 128K

Mercury 2 替代品

紫东太初

紫東太初是由中科院自動化所與武漢人工智慧研究院推出的多模態大模型，支援多輪問答、文本創作、圖像生成、3D理解與信號分析，適合圖文音、三維與信號資料處理。

PXZ AI

一個集成圖像、視頻、語音、寫作和聊天工具的全能AI平台，以增強創造力和協作。

Slidesgo

Slidesgo 是適用於 Google Slides、PowerPoint 與部分 Canva 工作流程的簡報範本平台，提供免費與 Premium 範本，並支援 AI 輔助簡報製作與團隊存取。

Wysera

Wysera 是一個 AI 商業平台，結合用於內容的 PostWyse 與用於 CRM 和營收流程的 OpsWyse，並由共享的 Wyse AI 提供支援。適合重視先審核後自動化的個人經營者、團隊與代理商。

Grok AI Assistant

Grok 是由 xAI 開發的一款免費 AI 助理，旨在優先考慮真實性和客觀性，同時提供即時資訊存取和圖像生成等進階功能。

Creativly

Creativly 是一款以網頁為基礎的 AI 創意工作室，能用簡短輸入快速生成視覺概念、產品 mockup 與風格化圖像，特別適合設計師、創作者與創業者進行快速視覺發想。