Composer 2.5
Composer 2.5 es un modelo de codificación con IA disponible en Cursor, diseñado para tareas agénticas largas, seguir instrucciones con mayor fiabilidad y colaborar mejor.
¿Qué es Composer 2.5?
Composer 2.5 es un modelo de codificación con IA disponible en Cursor. Se describe como una mejora sustancial respecto a Composer 2, con mejor rendimiento en tareas agénticas de larga duración, mayor fiabilidad al seguir instrucciones y un comportamiento de colaboración más consistente.
El modelo se basa en el mismo checkpoint de código abierto que Composer 2, Kimi K2.5 de Moonshot, pero se entrena con métodos adicionales orientados a mejorar tanto la inteligencia como la usabilidad. Según la fuente, el proceso de entrenamiento incluye reinforcement learning a mayor escala, entornos de RL más complejos, feedback textual dirigido y más tareas sintéticas basadas en codebases reales.
Características clave
- Mejor manejo de tareas de largo horizonte: Composer 2.5 está diseñado para seguir siendo eficaz en trabajos agénticos de larga duración, donde las ejecuciones pueden abarcar muchos tokens y múltiples llamadas a herramientas.
- Seguimiento de instrucciones más fiable: el modelo se entrena para seguir instrucciones complejas de forma más consistente, algo importante en flujos de trabajo de programación con muchos pasos y restricciones.
- Feedback textual dirigido en RL: el entrenamiento puede insertar pistas localizadas en el contexto de un turno específico con problemas y luego destilar el comportamiento deseado en la política para ese punto de la trayectoria.
- Entrenamiento ampliado con tareas sintéticas: Composer 2.5 usa 25 veces más tareas sintéticas que Composer 2, con tareas basadas en codebases reales y recompensas verificables.
- Ajuste del comportamiento más allá de las métricas de benchmark: el proceso de entrenamiento también ajusta el estilo de comunicación y la calibración del esfuerzo, que la fuente señala como importantes para la utilidad en el mundo real.
- Construido sobre un checkpoint de código abierto: Composer 2.5 continúa a partir del checkpoint Kimi K2.5 de Moonshot, mientras que Cursor también menciona trabajo con SpaceXAI en un modelo mucho mayor entrenado desde cero.
Cómo usar Composer 2.5
En Cursor, los usuarios seleccionarían Composer 2.5 como modelo para tareas de programación y tareas agénticas. Está pensado para flujos de trabajo que implican interacción prolongada, uso de herramientas, cambios en el código y refinamiento iterativo.
Un flujo de trabajo típico sería darle al modelo una tarea de programación, dejar que inspeccione la codebase, siga instrucciones, llame a herramientas según sea necesario y luego revise los cambios o explicaciones resultantes. Es especialmente relevante cuando la tarea es de larga duración o requiere una adhesión cuidadosa a las restricciones.
Casos de uso
- Tareas de programación de larga duración: útil cuando un agente necesita tomar muchas decisiones a lo largo de una ejecución extensa, como editar varios archivos o iterar sobre una funcionalidad.
- Seguimiento de instrucciones complejas: adecuado para tareas con restricciones detalladas, como preservar el comportamiento mientras se cambian detalles de implementación.
- Flujos de trabajo con muchas herramientas: útil cuando el modelo debe usar herramientas repetidamente y recuperarse de errores locales, como herramientas no disponibles o llamadas fallidas.
- Tareas sintéticas basadas en codebases: admite configuraciones de entrenamiento y evaluación en las que el modelo trabaja sobre codebases reales con pruebas y resultados verificables.
- Colaboración sensible a la comunicación: relevante cuando a los usuarios les importa no solo la corrección, sino también explicaciones más claras, estilo y esfuerzo calibrado.
Preguntas frecuentes
¿Composer 2.5 es un producto nuevo o una actualización del modelo?
Es una nueva versión de Composer disponible en Cursor, presentada como una mejora respecto a Composer 2.
¿La fuente dice que Composer 2.5 se basa en un checkpoint distinto al de Composer 2?
No. La fuente dice que está construido sobre el mismo checkpoint de código abierto que Composer 2: Kimi K2.5 de Moonshot.
¿Qué cambió en el entrenamiento?
La fuente destaca entrenamiento a mayor escala, entornos de RL más complejos, feedback textual dirigido y un conjunto más grande de tareas sintéticas.
¿Está pensado principalmente para el rendimiento en benchmarks?
No solo. La fuente enfatiza mejoras de comportamiento y usabilidad, incluido el estilo de comunicación y la calibración del esfuerzo, además de la inteligencia.
Alternativas
- Composer 2: la versión anterior del modelo de Cursor, útil como referencia directa para comparar el nuevo entrenamiento y los cambios de comportamiento.
- Agentes de codificación de uso general: otros asistentes de codificación con IA que se centran en la generación de código y el uso de herramientas, aunque pueden diferir en cómo manejan tareas de largo horizonte y el ajuste del comportamiento.
- Asistentes LLM integrados en el IDE: asistentes basados en el editor que dan soporte a flujos de trabajo de programación, pero que quizá no usen el mismo enfoque de entrenamiento intensivo en RL descrito para Composer 2.5.
- Revisión de código humana y desarrollo iterativo: una alternativa sin modelo para equipos que prefieren control manual sobre cambios largos y complejos, especialmente cuando importa la precisión del comportamiento.
Alternativas
Devin
Devin es un agente de IA para programar que ayuda a equipos a completar migraciones y refactorizaciones grandes en paralelo, con aprobación humana.
AakarDev AI
AakarDev AI es una plataforma poderosa que simplifica el desarrollo de aplicaciones de IA con integración fluida de bases de datos vectoriales, permitiendo un despliegue y escalabilidad rápidos.
Arduino VENTUNO Q
Arduino VENTUNO Q es un ordenador de edge AI para robótica: combina inferencia acelerada y microcontrolador para control determinista, con Arduino App Lab.
imgcook
imgcook es una herramienta inteligente que convierte maquetas de diseño en código listo para producción y de alta calidad con un solo clic.
open-codex-computer-use
open-codex-computer-use es un servicio open source de “Computer Use” como servidor MCP para automatizar acciones GUI en macOS, Linux y Windows.
Codex Plugins
Usa Codex Plugins para combinar skills, integraciones de apps y servidores MCP en flujos reutilizables que amplían el acceso de Codex a Gmail, Drive y Slack.