UStackUStack
MiniCPM5-1B icon

MiniCPM5-1B

MiniCPM5-1Bは、ローカルアシスタント、コーディングエージェント、ツール利用、推論に対応する10億パラメータのオープンソース言語モデルです。長文コンテキストと高速チャット・思考モードをサポートし、複数形式で提供します。

MiniCPM5-1B

MiniCPM5-1Bとは?

MiniCPM5-1Bは、MiniCPM5シリーズの最初のチェックポイントで、ローカルアシスタント、コーディングエージェント、ツール利用ワークフロー、推論タスク向けに設計された、10億パラメータの密なTransformerです。オンデバイスおよびリソース制約のある環境での展開を想定しつつ、同一チェックポイントからネイティブな長文コンテキスト対応と、thinkingあり・なしの両チャットモードをサポートします。

このモデルは1Bクラスのオープンソース版として提供され、BF16チェックポイント、llama.cpp向けGGUF、Ollama、LM Studio、Apple Silicon向けMLXなど、異なるランタイムに対応する複数形式で利用できます。ページでは、展開、ファインチューニング、このモデルを中心に構築したローカルデスクトップペットデモ向けの補助リソースも紹介されています。

主な機能

  • 密な1B Transformerアーキテクチャ: 小規模展開向けのサイズながら、汎用的な因果言語モデルとして機能。
  • ネイティブな長文コンテキスト対応: コンテキスト長は131,072トークンで、長いプロンプトや拡張タスクのワークフローに適します。
  • ハイブリッド推論モード: 内蔵の<think>チャットテンプレートはenable_thinkingで切り替え可能で、同じチェックポイントで高速チャットと慎重な推論の両方に対応。
  • 複数のリリース形式: BF16、SFTのみ、ベースチェックポイント、GGUF、MLX版が提供され、環境に合わせて選択可能。
  • ツール利用とコーディング重視: エージェント的なツール利用、コード生成、難しい推論向けに位置づけられており、MiniCPM GitHubリポジトリには展開・ファインチューニング用のcookbookが用意されています。
  • RLとOPDによる後訓練: リリース版モデルの学習レシピにはSFT、強化学習、on-policy distillationが使われています。

MiniCPM5-1Bの使い方

まず、環境に合うチェックポイント形式を選び、好みの推論バックエンドまたはファインチューニングフレームワークで読み込みます。ローカルチャットとして使う場合は通常モードを、推論が必要な場合は対応するチャット設定でthinkingテンプレートを有効にします。リポジトリでは主要バックエンド向けのcookbookとAgent Skillsが利用できると案内されており、展開と適応のためのガイド付きセットアップが想定されています。

使用例

  • 個人環境でのローカルアシスタント: 大規模なホスト型モデルに頼らず、日常会話、要約、一般的な支援に使えるコンパクトモデルとして運用。
  • コーディングエージェントのワークフロー: 小さめのローカルモデルが望ましい環境で、コード生成やエージェント的なツール利用に活用。
  • 推論重視のプロンプト: より慎重な段階的応答が役立つ難しい質問ではthinkingモードに切り替え。
  • 長文コンテキストタスク: 拡張された文脈処理が必要なプロンプト、文書、会話に適用。
  • Apple Siliconまたはllama.cppでの展開: それぞれのローカルランタイムを対象にする場合はMLXまたはGGUF版を選択。

FAQ

MiniCPM5-1Bはチャットモデルですか、それともベースモデルですか? チャットと推論用途向けの後訓練済みチェックポイントとして提供されており、モデルディレクトリには別途ベース版とSFTのみ版も掲載されています。

高速な回答とより深い推論の両方に対応しますか? はい。ページでは、同じチェックポイントが内蔵テンプレートを通じてThinkモードとNo Thinkモードの両方に対応すると説明されています。

長文コンテキストをサポートしますか? はい。モデル情報には131,072トークンのコンテキスト長が記載されています。

異なるファイル形式はありますか? はい。モデル一覧には、メインのリリースチェックポイントに加えてBF16、GGUF、MLX版が含まれています。

クラウド専用の展開向けですか? いいえ。製品はオンデバイス、ローカル展開、リソース制約のあるシナリオに適していると明記されています。

代替候補

  • ページで挙げられているベースラインのような、0.6B〜1.2B帯の他の小型オープンソースチャットモデルは、同程度のモデルサイズとローカル展開目的を求める場合の最も近い比較対象です。
  • より大きなローカルLLMは生の性能が高い場合がありますが、より多くのメモリと計算資源が必要なため、MiniCPM5-1Bのコンパクトな展開重視にはあまり向きません。
  • 同系列のベースチェックポイントは、公開済みのチャット向けモデルを使うのではなく、自前で教師ありファインチューニングや後訓練を行いたい場合の代替候補です。
  • 主要な判断基準がモデル系列ではなくランタイム互換性である場合、他系列のGGUF版やMLX版のモデルビルドが関連候補になります。