UStackUStack
Long Horizon icon

Long Horizon

Long Horizon é uma ferramenta de testes de frontend agentic que planeja, escreve e executa testes reais no navegador, gerando relatórios compartilháveis.

Long Horizon

O que é Long Horizon?

Long Horizon é uma ferramenta de testes de frontend agentic que permite que um agente de codificação planeje, crie e execute testes baseados em navegador para uma aplicação web. Seu propósito principal é ajudar equipes a verificar recursos em um navegador real e expor problemas com evidências revisáveis.

Em vez de apenas gerar testes, o Long Horizon os executa em uma sessão real de navegador e produz relatórios de execução compartilháveis. Esses relatórios incluem logs de execução e anexos como capturas de tela e detalhes de rede, suportando depuração e execuções de testes reproduzíveis.

Principais Recursos

  • Planejamento de testes impulsionado por agente a partir do contexto do seu recurso e repositório
    • O agente cria o que testar (caminhos principais, casos de borda e cenários de falha) com base nos inputs do recurso e repositório.
  • Execução automatizada de testes baseados em navegador
    • Os testes são executados em um navegador real, então as asserções refletem o comportamento real da UI e interações de rede.
  • Relatórios de execução compartilháveis com logs e anexos
    • As saídas são projetadas para revisão, incluindo logs de execução e artefatos como capturas de tela.
  • Execuções confiáveis e reproduzíveis
    • O fluxo de trabalho enfatiza sessões repetíveis para que falhas possam ser revisadas e compreendidas.
  • Criação de testes escrita nos arquivos de teste do projeto
    • O agente escreve testes no seu projeto (exemplos mostrados incluem múltiplos arquivos de teste relacionados ao checkout).
  • Fluxo de depuração para testes com falha
    • Quando uma execução falha, o agente pode identificar o que quebrou e propor mudanças; desenvolvedores podem revisar logs e ajudar em cenários complicados.
  • Modo lento / modo passo para inspeção manual
    • Execuções podem ser realizadas em modos para ajudar desenvolvedores a observar o comportamento durante falhas ou fluxos complexos.
  • Feedback de UI para guiar mudanças do agente
    • Usuários podem deixar feedback diretamente na UI com comentários em nível de elemento; o agente incorpora contexto como capturas de tela e HTML do elemento.

Como Usar Long Horizon

  1. Comece com um recurso em desenvolvimento e forneça o contexto relevante do repositório ao agente.
  2. Peça ao agente para criar um plano de testes para o recurso (incluindo caminhos felizes, casos de borda e cenários de erro).
  3. Tenha o agente escrever os testes no seu projeto, depois execute os testes em um navegador real.
  4. Revise o relatório de execução gerado, incluindo logs e capturas de tela anexadas.
  5. Se um teste falhar, use o fluxo de depuração — revise a saída da falha e deixe o agente propor correções, depois reexecute.

Nos exemplos fornecidos, o fluxo de trabalho inclui planejamento de cenários para checkout (ex.: “checkout — happy path”, “cart — empty checkout blocked” e “payment — decline and retry”), execução deles em uma sessão de navegador e validação de asserções como IDs de confirmação e visibilidade do DOM.

Casos de Uso

  • Regressão de caminho feliz de checkout para usuários logados
    • Execute um cenário planejado por agente onde um usuário logado completa uma compra e verifique que a rota de confirmação renderiza identificadores esperados (ex.: ID do pedido e email no DOM).
  • Prevenção de checkout quando o carrinho está vazio
    • Valide que o call-to-action de checkout permaneça desabilitado quando o carrinho está vazio e que chamadas de rede relacionadas a pagamento não sejam acionadas.
  • Tratamento de fluxos de declínio de cartão e retry
    • Simule um cartão declinado, confirme que um erro inline é exibido e verifique que usuários podem alterar o método de pagamento e completar o pedido com sucesso.
  • Teste de checkout como convidado e fluxos de pagamento só com email
    • Verifique um cenário de checkout onde um usuário prossegue sem conta e garanta que verificações pré-pagamento (como checagens de fraude mencionadas na fonte) ocorram antes do pagamento.
  • Depuração e correção de falhas em fluxos complexos
    • Quando um teste de navegador falha devido a uma condição de bloqueio inesperada (ex.: gating de inventário no checkout), use logs para identificar o problema, atualize mocks/stubs (como disponibilidade de estoque) e reexecute.

FAQ

O Long Horizon gera testes ou apenas os executa?

Ambos. O agente cria um plano de teste, escreve os testes no projeto e depois executa esses testes em um navegador real.

Que tipo de saída o Long Horizon produz após a execução de um teste?

Relatórios de execução compartilháveis que incluem logs completos de execução e anexos como capturas de tela, com detalhes adicionais como informações de rede.

Desenvolvedores podem revisar falhas e avançar passo a passo nos cenários?

Sim. O fluxo inclui revisão pelos desenvolvedores dos logs de execução e opções como modo lento e modo passo para inspeção manual.

Como funciona a depuração do agente?

Quando um teste falha, o agente identifica o que quebrou e sugere correções; desenvolvedores também podem ajudar, por exemplo, ajustando mocks (como de inventário) e reexecutando o mesmo teste.

Como os membros da equipe podem fornecer orientação ao agente durante as correções?

Há uma interface de feedback na UI onde usuários deixam comentários em elementos da UI. O agente usa a captura de tela, comentários e HTML do elemento.

Alternativas

  • Frameworks convencionais de testes end-to-end de frontend
    • Ferramentas da categoria E2E podem executar testes no navegador, mas geralmente exigem mais planejamento e escrita manual de testes em vez de planejamento, escrita e execução impulsionados por agente.
  • Conjuntos de testes QA scriptados com triagem manual
    • Equipes podem escrever e executar testes scriptados e depurar usando logs; a diferença é que o Long Horizon enfatiza um fluxo assistido por agente para planejamento, escrita e depuração.
  • Ferramentas de fluxo agentic que geram testes sem execuções em navegador real
    • Algumas abordagens focam em gerar código de teste ou relatórios; o posicionamento do Long Horizon é especificamente em torno de execução em navegador real com relatórios de execução revisáveis.
  • Pipelines de testes no navegador baseados em CI
    • Configurações de integração contínua podem executar testes no navegador repetidamente; o Long Horizon centra-se na criação agentic de testes e relatórios de execução compartilháveis para apoiar a entrega de funcionalidades e depuração.