UStackUStack
MiniCPM-o 4.5 favicon

MiniCPM-o 4.5

MiniCPM-o 4.5는 시각, 음성, 텍스트 데이터를 동시에 처리하고 이해할 수 있도록 설계된 첨단 멀티모달 AI 모델입니다. SigLip2, Whisper-medium, CosyVoice2, Qwen3-8B와 같은 최첨단 아키텍처의 조합으로 구축되었으며, 총 90억 개의 파라미터를 갖추고 있습니다. 이 모델은 양방향 멀티모달 라이브 스트리밍에 뛰어나며, 실시간으로 유연한 상호작용을 가능하게 하여 동시에 보고 듣고 말할 수 있습니다. 이러한 능력은 비전, 음성, 언어 이해가 통합된 애플리케이션에 적합한 다목적 도구입니다.

MiniCPM-o 4.5
MiniCPM-o 4.5 | UStack