UStackUStack
MiniCPM-o 4.5 favicon

MiniCPM-o 4.5

MiniCPM-o 4.5 est un modèle d'IA multimodal avancé pour la vision, la parole et la compréhension du langage, permettant la diffusion en direct en mode duplex intégral et l'interaction en temps réel.

MiniCPM-o 4.5

Qu'est-ce que MiniCPM-o 4.5 ?

MiniCPM-o 4.5 est un modèle d'IA multimodal avancé conçu pour traiter et comprendre simultanément des données visuelles, orales et textuelles. Construit avec une combinaison d'architectures de pointe telles que SigLip2, Whisper-medium, CosyVoice2 et Qwen3-8B, il comporte un total de 9 milliards de paramètres. Ce modèle est conçu pour exceller dans la diffusion multimodale en mode duplex intégral, permettant des interactions en temps réel, fluides, qui voient, entendent et parlent simultanément. Ses capacités en font un outil polyvalent pour des applications nécessitant une compréhension intégrée de la vision, de la parole et du langage.

MiniCPM-o 4.5 | UStack