UStackUStack
MiniCPM-o 4.5 favicon

MiniCPM-o 4.5

MiniCPM-o 4.5 es un modelo de IA multimodal que permite la comprensión en tiempo real de visión, habla y lenguaje, habilitando transmisiones en vivo de doble vía y interacción en tiempo real.

MiniCPM-o 4.5

¿Qué es MiniCPM-o 4.5?

MiniCPM-o 4.5 es un modelo de IA multimodal avanzado diseñado para procesar y comprender datos visuales, de voz y textuales de manera simultánea. Construido con una combinación de arquitecturas de última generación como SigLip2, Whisper-medium, CosyVoice2 y Qwen3-8B, cuenta con un total de 9 mil millones de parámetros. Este modelo está diseñado para sobresalir en transmisiones en vivo multimodales de doble vía, permitiendo interacciones en tiempo real y fluidas que ven, escuchan y hablan simultáneamente. Sus capacidades lo convierten en una herramienta versátil para aplicaciones que requieren comprensión integrada de visión, habla y lenguaje.