UStackUStack
MiniCPM-o 4.5 favicon

MiniCPM-o 4.5

MiniCPM-o 4.5は、視覚、音声、言語の理解を同時に行う高度なマルチモーダルAIモデルです。最先端のアーキテクチャ(SigLip2、Whisper-medium、CosyVoice2、Qwen3-8B)を組み合わせて構築され、合計90億のパラメータを持ちます。このモデルは、全二重のマルチモーダルライブストリーミングに優れており、リアルタイムで流動的なインタラクションを実現します。視覚、音声、言語の統合された理解を必要とするアプリケーションにとって、多用途なツールです。

MiniCPM-o 4.5
MiniCPM-o 4.5 | UStack