UStackUStack
Composer 2.5 icon

Composer 2.5

Composer 2.5 é um modelo de codificação com IA no Cursor, criado para tarefas agentic longas, seguir instruções com mais confiabilidade e colaborar melhor.

Composer 2.5

O que é Composer 2.5?

Composer 2.5 é um modelo de codificação com IA disponível no Cursor. É descrito como uma melhoria significativa em relação ao Composer 2, com desempenho mais forte em tarefas agentic de longa duração, melhor seguimento de instruções e comportamento de colaboração mais consistente.

O modelo é construído sobre o mesmo checkpoint open-source do Composer 2, o Kimi K2.5 da Moonshot, mas é treinado com métodos adicionais voltados a melhorar tanto a inteligência quanto a usabilidade. Segundo a fonte, o processo de treino inclui reinforcement learning em maior escala, ambientes de RL mais complexos, feedback textual direcionado e mais tarefas sintéticas baseadas em codebases reais.

Principais funcionalidades

  • Melhor gestão de tarefas de longo horizonte: Composer 2.5 foi criado para manter a eficácia em trabalhos agentic longos, em que as execuções podem abranger muitos tokens e várias chamadas de ferramentas.
  • Seguimento de instruções mais fiável: o modelo é treinado para seguir instruções complexas de forma mais consistente, o que é importante em fluxos de trabalho de programação com muitos passos e restrições.
  • Feedback textual direcionado em RL: o treino pode inserir pistas localizadas no contexto de uma volta específica problemática e depois destilar o comportamento desejado para a política nesse ponto da trajetória.
  • Treino expandido com tarefas sintéticas: Composer 2.5 usa 25x mais tarefas sintéticas do que o Composer 2, com tarefas baseadas em codebases reais e recompensas verificáveis.
  • Ajuste comportamental para além das pontuações em benchmarks: o processo de treino também ajusta o estilo de comunicação e a calibração do esforço, que a fonte considera importantes para a utilidade no mundo real.
  • Construído sobre um checkpoint open-source: Composer 2.5 continua a partir do checkpoint Kimi K2.5 da Moonshot, enquanto o Cursor também menciona trabalho com a SpaceXAI num modelo muito maior treinado de raiz.

Como usar o Composer 2.5

No Cursor, os utilizadores escolheriam o Composer 2.5 como modelo para tarefas de programação e agentic. Destina-se a fluxos de trabalho que envolvem interação prolongada, uso de ferramentas, alterações de código e refinamento iterativo.

Um fluxo de trabalho típico seria dar ao modelo uma tarefa de programação, deixá-lo inspecionar a codebase, seguir instruções, chamar ferramentas conforme necessário e depois rever as alterações ou explicações resultantes. É especialmente relevante quando a tarefa é longa ou requer adesão cuidadosa a restrições.

Casos de uso

  • Tarefas de programação de longa duração: útil quando um agente precisa tomar muitas decisões ao longo de uma execução extensa, como editar vários ficheiros ou iterar sobre uma funcionalidade.
  • Seguimento de instruções complexas: adequado para tarefas com restrições detalhadas, como preservar o comportamento enquanto se alteram detalhes de implementação.
  • Fluxos de trabalho com uso intensivo de ferramentas: útil quando o modelo precisa usar ferramentas repetidamente e recuperar de erros locais, como ferramentas indisponíveis ou chamadas falhadas.
  • Tarefas sintéticas baseadas em codebases: suporta configurações de treino e avaliação em que o modelo trabalha sobre codebases reais com testes e resultados verificáveis.
  • Colaboração sensível à comunicação: relevante quando os utilizadores se preocupam não só com a correção, mas também com explicações mais claras, estilo e esforço calibrado.

FAQ

O Composer 2.5 é um produto novo ou uma atualização do modelo? É uma nova versão do Composer disponível no Cursor, posicionada como uma melhoria em relação ao Composer 2.

A fonte diz que o Composer 2.5 é baseado num checkpoint diferente do Composer 2? Não. A fonte diz que ele é construído sobre o mesmo checkpoint open-source do Composer 2: o Kimi K2.5 da Moonshot.

O que mudou no treino? A fonte destaca treino em escala, ambientes de RL mais complexos, feedback textual direcionado e um conjunto maior de tarefas sintéticas.

É principalmente para desempenho em benchmarks? Não apenas. A fonte enfatiza melhorias de comportamento e usabilidade, incluindo estilo de comunicação e calibração do esforço, além da inteligência.

Alternativas

  • Composer 2: a versão anterior do modelo do Cursor, útil como referência direta para comparar o novo treino e as mudanças de comportamento.
  • Agentes de programação de uso geral: outros assistentes de codificação com IA que se focam na geração de código e no uso de ferramentas, embora possam diferir na forma como lidam com tarefas de longo horizonte e ajuste comportamental.
  • Assistentes LLM integrados no IDE: assistentes baseados no editor que suportam fluxos de trabalho de programação, mas podem não usar a mesma abordagem de treino intensivo em RL descrita para o Composer 2.5.
  • Revisão de código humana e desenvolvimento iterativo: uma alternativa sem modelo para equipas que preferem controlo manual sobre alterações longas e complexas, especialmente quando a precisão do comportamento é importante.
Composer 2.5 | UStack