Composer 2.5
Composer 2.5 é um modelo de codificação com IA no Cursor, criado para tarefas agentic longas, seguir instruções com mais confiabilidade e colaborar melhor.
O que é Composer 2.5?
Composer 2.5 é um modelo de codificação com IA disponível no Cursor. É descrito como uma melhoria significativa em relação ao Composer 2, com desempenho mais forte em tarefas agentic de longa duração, melhor seguimento de instruções e comportamento de colaboração mais consistente.
O modelo é construído sobre o mesmo checkpoint open-source do Composer 2, o Kimi K2.5 da Moonshot, mas é treinado com métodos adicionais voltados a melhorar tanto a inteligência quanto a usabilidade. Segundo a fonte, o processo de treino inclui reinforcement learning em maior escala, ambientes de RL mais complexos, feedback textual direcionado e mais tarefas sintéticas baseadas em codebases reais.
Principais funcionalidades
- Melhor gestão de tarefas de longo horizonte: Composer 2.5 foi criado para manter a eficácia em trabalhos agentic longos, em que as execuções podem abranger muitos tokens e várias chamadas de ferramentas.
- Seguimento de instruções mais fiável: o modelo é treinado para seguir instruções complexas de forma mais consistente, o que é importante em fluxos de trabalho de programação com muitos passos e restrições.
- Feedback textual direcionado em RL: o treino pode inserir pistas localizadas no contexto de uma volta específica problemática e depois destilar o comportamento desejado para a política nesse ponto da trajetória.
- Treino expandido com tarefas sintéticas: Composer 2.5 usa 25x mais tarefas sintéticas do que o Composer 2, com tarefas baseadas em codebases reais e recompensas verificáveis.
- Ajuste comportamental para além das pontuações em benchmarks: o processo de treino também ajusta o estilo de comunicação e a calibração do esforço, que a fonte considera importantes para a utilidade no mundo real.
- Construído sobre um checkpoint open-source: Composer 2.5 continua a partir do checkpoint Kimi K2.5 da Moonshot, enquanto o Cursor também menciona trabalho com a SpaceXAI num modelo muito maior treinado de raiz.
Como usar o Composer 2.5
No Cursor, os utilizadores escolheriam o Composer 2.5 como modelo para tarefas de programação e agentic. Destina-se a fluxos de trabalho que envolvem interação prolongada, uso de ferramentas, alterações de código e refinamento iterativo.
Um fluxo de trabalho típico seria dar ao modelo uma tarefa de programação, deixá-lo inspecionar a codebase, seguir instruções, chamar ferramentas conforme necessário e depois rever as alterações ou explicações resultantes. É especialmente relevante quando a tarefa é longa ou requer adesão cuidadosa a restrições.
Casos de uso
- Tarefas de programação de longa duração: útil quando um agente precisa tomar muitas decisões ao longo de uma execução extensa, como editar vários ficheiros ou iterar sobre uma funcionalidade.
- Seguimento de instruções complexas: adequado para tarefas com restrições detalhadas, como preservar o comportamento enquanto se alteram detalhes de implementação.
- Fluxos de trabalho com uso intensivo de ferramentas: útil quando o modelo precisa usar ferramentas repetidamente e recuperar de erros locais, como ferramentas indisponíveis ou chamadas falhadas.
- Tarefas sintéticas baseadas em codebases: suporta configurações de treino e avaliação em que o modelo trabalha sobre codebases reais com testes e resultados verificáveis.
- Colaboração sensível à comunicação: relevante quando os utilizadores se preocupam não só com a correção, mas também com explicações mais claras, estilo e esforço calibrado.
FAQ
O Composer 2.5 é um produto novo ou uma atualização do modelo? É uma nova versão do Composer disponível no Cursor, posicionada como uma melhoria em relação ao Composer 2.
A fonte diz que o Composer 2.5 é baseado num checkpoint diferente do Composer 2? Não. A fonte diz que ele é construído sobre o mesmo checkpoint open-source do Composer 2: o Kimi K2.5 da Moonshot.
O que mudou no treino? A fonte destaca treino em escala, ambientes de RL mais complexos, feedback textual direcionado e um conjunto maior de tarefas sintéticas.
É principalmente para desempenho em benchmarks? Não apenas. A fonte enfatiza melhorias de comportamento e usabilidade, incluindo estilo de comunicação e calibração do esforço, além da inteligência.
Alternativas
- Composer 2: a versão anterior do modelo do Cursor, útil como referência direta para comparar o novo treino e as mudanças de comportamento.
- Agentes de programação de uso geral: outros assistentes de codificação com IA que se focam na geração de código e no uso de ferramentas, embora possam diferir na forma como lidam com tarefas de longo horizonte e ajuste comportamental.
- Assistentes LLM integrados no IDE: assistentes baseados no editor que suportam fluxos de trabalho de programação, mas podem não usar a mesma abordagem de treino intensivo em RL descrita para o Composer 2.5.
- Revisão de código humana e desenvolvimento iterativo: uma alternativa sem modelo para equipas que preferem controlo manual sobre alterações longas e complexas, especialmente quando a precisão do comportamento é importante.
Alternativas
Devin
Devin é um agente de IA para codificação que ajuda equipes de software em migrações e grandes refatorações, executando subtarefas em paralelo.
AakarDev AI
AakarDev AI é uma plataforma poderosa que simplifica o desenvolvimento de aplicações de IA com integração perfeita de banco de dados vetorial, permitindo implantação rápida e escalabilidade.
Arduino VENTUNO Q
Arduino VENTUNO Q é um computador edge AI para robótica, unindo inferência e microcontrolador para controle determinístico. Desenvolva no Arduino App Lab.
imgcook
imgcook é uma ferramenta inteligente que converte maquetes de design em código de alta qualidade, pronto para produção, com um único clique.
open-codex-computer-use
open-codex-computer-use: serviço open-source “Computer Use” em formato MCP, para agentes executarem ações de GUI na área de trabalho no macOS, Linux e Windows.
Codex Plugins
Use Codex Plugins para combinar skills, integrações de apps e servidores MCP em fluxos reutilizáveis, ampliando o acesso do Codex a Gmail, Drive e Slack.