Long Horizon

O que é Long Horizon?

Long Horizon é uma ferramenta de testes de frontend agentic que permite que um agente de codificação planeje, crie e execute testes baseados em navegador para uma aplicação web. Seu propósito principal é ajudar equipes a verificar recursos em um navegador real e expor problemas com evidências revisáveis.

Em vez de apenas gerar testes, o Long Horizon os executa em uma sessão real de navegador e produz relatórios de execução compartilháveis. Esses relatórios incluem logs de execução e anexos como capturas de tela e detalhes de rede, suportando depuração e execuções de testes reproduzíveis.

Principais Recursos

Planejamento de testes impulsionado por agente a partir do contexto do seu recurso e repositório
- O agente cria o que testar (caminhos principais, casos de borda e cenários de falha) com base nos inputs do recurso e repositório.
Execução automatizada de testes baseados em navegador
- Os testes são executados em um navegador real, então as asserções refletem o comportamento real da UI e interações de rede.
Relatórios de execução compartilháveis com logs e anexos
- As saídas são projetadas para revisão, incluindo logs de execução e artefatos como capturas de tela.
Execuções confiáveis e reproduzíveis
- O fluxo de trabalho enfatiza sessões repetíveis para que falhas possam ser revisadas e compreendidas.
Criação de testes escrita nos arquivos de teste do projeto
- O agente escreve testes no seu projeto (exemplos mostrados incluem múltiplos arquivos de teste relacionados ao checkout).
Fluxo de depuração para testes com falha
- Quando uma execução falha, o agente pode identificar o que quebrou e propor mudanças; desenvolvedores podem revisar logs e ajudar em cenários complicados.
Modo lento / modo passo para inspeção manual
- Execuções podem ser realizadas em modos para ajudar desenvolvedores a observar o comportamento durante falhas ou fluxos complexos.
Feedback de UI para guiar mudanças do agente
- Usuários podem deixar feedback diretamente na UI com comentários em nível de elemento; o agente incorpora contexto como capturas de tela e HTML do elemento.

Como Usar Long Horizon

Comece com um recurso em desenvolvimento e forneça o contexto relevante do repositório ao agente.
Peça ao agente para criar um plano de testes para o recurso (incluindo caminhos felizes, casos de borda e cenários de erro).
Tenha o agente escrever os testes no seu projeto, depois execute os testes em um navegador real.
Revise o relatório de execução gerado, incluindo logs e capturas de tela anexadas.
Se um teste falhar, use o fluxo de depuração — revise a saída da falha e deixe o agente propor correções, depois reexecute.

Nos exemplos fornecidos, o fluxo de trabalho inclui planejamento de cenários para checkout (ex.: “checkout — happy path”, “cart — empty checkout blocked” e “payment — decline and retry”), execução deles em uma sessão de navegador e validação de asserções como IDs de confirmação e visibilidade do DOM.

Casos de Uso

Regressão de caminho feliz de checkout para usuários logados
- Execute um cenário planejado por agente onde um usuário logado completa uma compra e verifique que a rota de confirmação renderiza identificadores esperados (ex.: ID do pedido e email no DOM).
Prevenção de checkout quando o carrinho está vazio
- Valide que o call-to-action de checkout permaneça desabilitado quando o carrinho está vazio e que chamadas de rede relacionadas a pagamento não sejam acionadas.
Tratamento de fluxos de declínio de cartão e retry
- Simule um cartão declinado, confirme que um erro inline é exibido e verifique que usuários podem alterar o método de pagamento e completar o pedido com sucesso.
Teste de checkout como convidado e fluxos de pagamento só com email
- Verifique um cenário de checkout onde um usuário prossegue sem conta e garanta que verificações pré-pagamento (como checagens de fraude mencionadas na fonte) ocorram antes do pagamento.
Depuração e correção de falhas em fluxos complexos
- Quando um teste de navegador falha devido a uma condição de bloqueio inesperada (ex.: gating de inventário no checkout), use logs para identificar o problema, atualize mocks/stubs (como disponibilidade de estoque) e reexecute.

FAQ

O Long Horizon gera testes ou apenas os executa?

Ambos. O agente cria um plano de teste, escreve os testes no projeto e depois executa esses testes em um navegador real.

Que tipo de saída o Long Horizon produz após a execução de um teste?

Relatórios de execução compartilháveis que incluem logs completos de execução e anexos como capturas de tela, com detalhes adicionais como informações de rede.

Desenvolvedores podem revisar falhas e avançar passo a passo nos cenários?

Sim. O fluxo inclui revisão pelos desenvolvedores dos logs de execução e opções como modo lento e modo passo para inspeção manual.

Como funciona a depuração do agente?

Quando um teste falha, o agente identifica o que quebrou e sugere correções; desenvolvedores também podem ajudar, por exemplo, ajustando mocks (como de inventário) e reexecutando o mesmo teste.

Como os membros da equipe podem fornecer orientação ao agente durante as correções?

Há uma interface de feedback na UI onde usuários deixam comentários em elementos da UI. O agente usa a captura de tela, comentários e HTML do elemento.

Alternativas

Frameworks convencionais de testes end-to-end de frontend
- Ferramentas da categoria E2E podem executar testes no navegador, mas geralmente exigem mais planejamento e escrita manual de testes em vez de planejamento, escrita e execução impulsionados por agente.
Conjuntos de testes QA scriptados com triagem manual
- Equipes podem escrever e executar testes scriptados e depurar usando logs; a diferença é que o Long Horizon enfatiza um fluxo assistido por agente para planejamento, escrita e depuração.
Ferramentas de fluxo agentic que geram testes sem execuções em navegador real
- Algumas abordagens focam em gerar código de teste ou relatórios; o posicionamento do Long Horizon é especificamente em torno de execução em navegador real com relatórios de execução revisáveis.
Pipelines de testes no navegador baseados em CI
- Configurações de integração contínua podem executar testes no navegador repetidamente; o Long Horizon centra-se na criação agentic de testes e relatórios de execução compartilháveis para apoiar a entrega de funcionalidades e depuração.

Long Horizon

O que é Long Horizon?

Principais Recursos

Como Usar Long Horizon

Casos de Uso

FAQ

O Long Horizon gera testes ou apenas os executa?

Que tipo de saída o Long Horizon produz após a execução de um teste?

Desenvolvedores podem revisar falhas e avançar passo a passo nos cenários?

Como funciona a depuração do agente?

Como os membros da equipe podem fornecer orientação ao agente durante as correções?

Alternativas

Alternativas

PromptLayer

Evidently AI

Crikket

Roo Code

Logic

TestLaunch Pro