MiniCPM5-1B

什麼是 MiniCPM5-1B？

MiniCPM5-1B 是 MiniCPM5 系列中的第一個 checkpoint，是一款稠密的 10 億參數 Transformer，專為本地助理、程式碼代理、工具使用流程與推理任務設計。它針對裝置端與資源受限環境部署而打造，同時仍可從同一個 checkpoint 支援原生長上下文，以及思考與非思考兩種聊天模式。

這個模型以 1B 級開源版本形式提供，並支援多種適用於不同執行環境的格式，包括 BF16 checkpoints、供 llama.cpp、Ollama 與 LM Studio 使用的 GGUF，以及適用於 Apple Silicon 的 MLX。此頁面也描述了支援部署、微調，以及基於該模型打造的本地桌面寵物 demo 資源。

主要功能

稠密 1B Transformer 架構：體積適合較小規模部署，同時仍是通用的因果語言模型。
原生長上下文支援：列出的上下文長度為 131,072 tokens，適合較長提示與延伸任務流程。
混合推理模式：內建 <think> 聊天模板可透過 enable_thinking 切換，讓同一個 checkpoint 同時支援快速聊天與深思推理。
多種發行格式：提供 BF16、SFT-only、base checkpoint、GGUF 與 MLX 版本，方便使用者依執行環境選擇。
以工具使用與程式碼為重點：此模型定位於代理式工具使用、程式碼生成與高難度推理，MiniCPM GitHub repo 中也提供部署與微調 cookbook。
以 RL 與 OPD 進行後訓練：此發行模型的訓練流程包含 SFT、強化學習與 on-policy distillation。

如何使用 MiniCPM5-1B

先選擇符合你環境的 checkpoint 格式，接著將其載入你偏好的推理後端或微調框架。若要本地聊天行為，使用一般模式；若需要推理，則在支援的聊天設定中啟用思考模板。儲存庫指出 major backends 都提供 cookbook 與 Agent Skills，代表部署與調整可沿著有引導的流程進行。

使用案例

個人硬體上的本地助理：在不依賴大型託管模型的情況下，執行日常聊天、摘要與一般協助。
程式碼代理工作流程：在偏好較小型本地模型的環境中，用於程式碼生成與代理式工具使用。
以推理為主的提示：切換到思考模式，處理較困難、較需要逐步回應的問題。
長上下文任務：用於需要延伸上下文處理的提示、文件或對話。
Apple Silicon 或 llama.cpp 部署：在對應的本地執行環境中，選擇 MLX 或 GGUF 發行版。

常見問題

MiniCPM5-1B 是聊天模型還是 base model？ 它以適用於聊天與推理的 post-trained checkpoint 形式發行，頁面也在模型目錄中列出獨立的 base 與 SFT-only 版本。

它能同時提供快速回答與更深入的推理嗎？ 可以。頁面表示同一個 checkpoint 可透過內建模板支援 Think 與 No Think 兩種聊天模式。

它支援長上下文嗎？ 可以。模型資訊列出的上下文長度為 131,072 tokens。

有不同檔案格式可用嗎？ 有。模型清單除了主要發行 checkpoint 外，還包含 BF16、GGUF 與 MLX 版本。

這是只用於雲端部署嗎？ 不是。此產品明確描述為適合裝置端、本地部署與資源受限場景。

替代方案

其他 0.6B 到 1.2B 範圍內的小型開源聊天模型，例如頁面上列出的基準模型，當你想要相近的模型大小與本地部署目標時，是最接近的比較對象。
較大的本地 LLM 可能具備更強的原始能力，但需要更多記憶體與運算資源，因此較不符合 MiniCPM5-1B 的精簡部署定位。
同系列的 base checkpoints 可作為替代方案，若你想自行進行監督式微調或後訓練，而不是直接使用已發行的聊天導向模型。
其他家族的 GGUF 或 MLX 專用模型建置，若你的主要考量是執行環境相容性而非模型家族選擇，則也值得參考。

MiniCPM5-1B

什麼是 MiniCPM5-1B？

主要功能

如何使用 MiniCPM5-1B

使用案例

常見問題

替代方案

替代品

BookAI.chat

Yorph AI

Lasso

Ably Chat

Tavus

HiringPartner.ai