UStackUStack
Composer 2 icon

Composer 2

Composer 2 è un modello di coding in Cursor per task a lungo orizzonte, con risultati di benchmark migliorati. Prezzi: $0,50/M input e $2,50/M output.

Composer 2

Cos'è Composer 2?

Composer 2 è un modello di coding disponibile in Cursor. È progettato per aiutare con task di coding che richiedono ragionamento multi-step e sequenze di azioni lunghe, con il modello addestrato e ottimizzato specificamente per workload di coding in stile agent.

Cursor riporta che Composer 2 offre risultati di benchmark migliorati (incluso Terminal-Bench 2.0 e SWE-bench Multilingual) rispetto a Composer 1, attribuendo i guadagni a un pretraining continuato seguito da reinforcement learning su task di coding a lungo orizzonte.

Caratteristiche Principali

  • Disponibile in Cursor: Composer 2 può essere usato direttamente nell'ambiente di Cursor per assistenza al coding.
  • Prestazioni migliorate sui benchmark di coding: Cursor cita grandi miglioramenti sui benchmark misurati, incluso Terminal-Bench 2.0 e SWE-bench Multilingual.
  • Reinforcement learning su task a lungo orizzonte: Il modello è addestrato tramite reinforcement learning su sequenze di azioni lunghe, mirate a task che richiedono centinaia di azioni.
  • Modalità di pricing multiple (incluso una variante più veloce): Composer 2 ha un'opzione standard e una variante più veloce, ognuna con pricing token diverso.
  • Metodologia di valutazione e contesto benchmark: Cursor descrive come sono calcolati i suoi punteggi riportati (incluso l'uso di Harbor per Terminal-Bench 2.0 e multiple iterazioni per coppia modello-agent), chiarendo cosa si intende per “performance”.

Come Usare Composer 2

  1. Apri Cursor e seleziona Composer 2 dalle opzioni del modello.
  2. Avvia un task di coding (ad esempio, chiedendo all'assistente di implementare o debuggare codice).
  3. Se la velocità è prioritaria, passa alla variante più veloce menzionata nei dettagli del modello di Cursor.
  4. Rivedi gli output e itera secondo necessità per il tuo obiettivo di coding specifico.

Casi d'Uso

  • Workflow di coding basati su terminal: Usa Composer 2 quando il tuo task coinvolge passi da command-line o terminal che possono estendersi su molte azioni, in linea con il focus di Cursor su Terminal-Bench 2.0.
  • Correzione o implementazione di cambiamenti su codebase reali: Per task simili alla valutazione SWE-bench Multilingual, usa Composer 2 per gestire cambiamenti di coding multi-step.
  • Task di sviluppo lunghi e multi-step: Quando una richiesta di coding prevede molte azioni iterative (centinaia di step, secondo la descrizione di Cursor), Composer 2 è posizionato per quel pattern.
  • Sviluppo attento ai costi: Scegli la modalità di pricing standard di Composer 2 quando vuoi i tassi di token input/output citati; opta per la variante più veloce quando priorizzi la velocità accettando l'economia token diversa.

FAQ

Quali benchmark usa Cursor per riportare le performance di Composer 2?

Cursor menziona miglioramenti su Terminal-Bench 2.0 e SWE-bench Multilingual. Spiega anche che il suo punteggio Cursor per Terminal-Bench 2.0 è stato calcolato usando il framework di valutazione Harbor con impostazioni benchmark di default.

Quanto costa Composer 2?

Cursor elenca $0.50/M token input e $2.50/M token output per Composer 2. Elenca anche una variante più veloce a $1.50/M input e $7.50/M output token.

Composer 2 supporta sequenze di azioni lunghe?

Cursor afferma che Composer 2 è addestrato per risolvere task challenging che richiedono centinaia di azioni.

Dove posso provare Composer 2?

Cursor dice che Composer 2 è disponibile in Cursor, e fa anche riferimento a provarlo nell'early alpha della nuova interfaccia di Cursor.

Composer 2 è l'unico modello disponibile in Cursor?

L'articolo di Cursor discute Composer 2 insieme ad altri modelli, notando che per modelli oltre Composer 2 ha usato il massimo tra punteggi leaderboard ufficiali e punteggi registrati nell'infrastruttura Cursor. L'articolo non specifica tutti i modelli disponibili, ma indica chiaramente un menu di modelli in Cursor.

Alternative

  • Altri modelli di coding disponibili in Cursor: Se hai bisogno di tradeoff velocità/costo diversi, passare a un'altra opzione di modello in Cursor è un'alternativa diretta, dato che Cursor discute di “other fast models” e fornisce una variante più veloce per Composer 2.
  • Workflow di coding agent-oriented senza questo modello specifico: Se il tuo workflow riguarda principalmente automazione terminal e step iterativi, considera approcci alternativi come l'uso di tipi di modello diversi focalizzati su pattern di valutazione terminal/agent (senza implicare un brand specifico).
  • Assistenza al coding con LLM general-purpose: Per task di generazione o editing di codice più semplici, un modello assistente general-purpose per coding può bastare, anche se Composer 2 è specificamente posizionato come forte per task a lungo orizzonte e multi-azione.
Composer 2 | UStack