UStackUStack
MiniCPM-o 4.5 favicon

MiniCPM-o 4.5

MiniCPM-o 4.5 è un modello di intelligenza artificiale multimodale che supporta visione, parlato e linguaggio, permettendo streaming live full-duplex e interazioni in tempo reale.

MiniCPM-o 4.5

Cos'è MiniCPM-o 4.5?

MiniCPM-o 4.5 è un modello di intelligenza artificiale multimodale avanzato progettato per elaborare e comprendere dati visivi, vocali e testuali contemporaneamente. Costruito con una combinazione di architetture all'avanguardia come SigLip2, Whisper-medium, CosyVoice2 e Qwen3-8B, dispone di un totale di 9 miliardi di parametri. Questo modello è ottimizzato per eccellere nello streaming multimodale full-duplex in tempo reale, consentendo interazioni fluide e simultanee che vedono, ascoltano e parlano contemporaneamente. Le sue capacità lo rendono uno strumento versatile per applicazioni che richiedono una comprensione integrata di visione, parlato e linguaggio.

MiniCPM-o 4.5 | UStack