UStackUStack
ClawdTalk icon

ClawdTalk

Dê voz ao seu Clawdbot: ClawdTalk adiciona chamadas de telefone bidirecionais com speech-to-text, transcrições e text-to-speech, com PIN opcional.

ClawdTalk

O que é ClawdTalk?

ClawdTalk é uma camada de chamadas de voz para o seu Clawdbot existente (OpenClaw) que permite que um bot gerencie chamadas telefônicas em vez de apenas texto. Seu bot continua recebendo e enviando mensagens estruturadas, enquanto o ClawdTalk adiciona speech-to-text, text-to-speech e chamadas bidirecionais para que os chamadores possam falar e ouvir respostas faladas.

O propósito principal é conectar seu bot a chamadas telefônicas reais: você instala a skill, verifica um número e depois liga para o seu Clawdbot como uma linha telefônica. As chamadas podem incluir proteção por PIN, e o sistema usa uma conexão WebSocket de saída persistente em vez de exigir um gateway exposto publicamente.

Principais Recursos

  • Chamadas bidirecionais (bot-para-telefone e telefone-para-bot): Ligue para o seu bot de um número de telefone ou peça ao seu bot “me ligue”; ambas as direções funcionam de imediato.
  • Speech-to-text com transcrições: A fala do chamador é transcrita e a transcrição é usada como entrada de texto do bot.
  • Text-to-speech com som natural (Telnyx NaturalHD): A saída de voz é gerada com text-to-speech “de som natural” (listado como vozes Telnyx), visando áudio claro e humano.
  • Proteção por PIN no lado do servidor: Defina um PIN para rejeitar chamadas que não apresentem o PIN exigido; a validação do chamador é aplicada no servidor.
  • Conexão privada baseada em WebSocket: O ClawdTalk usa uma conexão WebSocket de saída persistente para que seu bot não precise de um gateway exposto publicamente; é projetado para funcionar atrás de NAT e firewalls.
  • Suporte a voz HD: As chamadas para o bot suportam Voz HD usando codec AMR-WB (qualidade wideband).

Como Usar o ClawdTalk

  1. Conecte seu Clawdbot (OpenClaw). O ClawdTalk se posiciona como a camada de voz que fica ao lado do seu bot.
  2. Instale a skill ClawdTalk e verifique seu número (o site descreve isso como parte da configuração).
  3. (Recomendado) Configure proteção por PIN. Durante o cadastro, você define o PIN e as regras de acesso às chamadas.
  4. Comece a ligar para o seu bot. Use o número de telefone fornecido para ligar para o Clawdbot, ou use um fluxo “me ligue” acionado pelo seu bot.
  5. Observe transcrições de chamadas e respostas do bot. O bot recebe eventos de chamada (incluindo o texto do chamador) e envia de volta uma resposta de texto que é falada para o chamador.

Casos de Uso

  • Chamadas DevOps / resposta a incidentes: Um bot pode traduzir um comando de um chamador em uma ação (ex.: “faça rollback para a última versão estável e notifique a equipe”) e ler o resultado na mesma chamada.
  • Lembretes e consulta de informações de assistente pessoal: Usuários podem pedir dados baseados em tempo ou pessoais (ex.: ler calendário ou pontuação de sono) e receber um resumo falado.
  • Assistência em compras e checkout: Ligue para o seu bot para adicionar itens a um pedido de supermercado e confirmar totais ou horários de entrega.
  • Controle de casa inteligente: Peça ao bot para definir metas de termostato, ligar/desligar luzes e trancar portas; o bot responde com confirmações.
  • Fluxos de equipe que atualmente abrangem múltiplas ferramentas de chat: O site contrasta “sem” ClawdTalk (mensagens espalhadas por vários apps) com um fluxo de chamada único que pode entregar uma resposta estruturada.

FAQ

O que o ClawdTalk adiciona ao meu bot?
O ClawdTalk adiciona capacidades de chamadas de voz — speech-to-text, text-to-speech e chamadas telefônicas bidirecionais — enquanto seu bot continua gerenciando as interações de texto subjacentes.

Preciso expor meu bot à internet pública?
O site descreve o uso de uma conexão WebSocket de saída persistente para manter o bot privado e evitar a necessidade de um gateway exposto publicamente.

As chamadas podem ser restritas a chamadores autorizados?
Sim. O ClawdTalk suporta proteção por PIN, com aplicação no lado do servidor para rejeitar chamadas sem o PIN exigido.

Os chamadores recebem transcrições?
O fluxo de chamada descrito inclui ler a transcrição e usar a transcrição como entrada do bot; “transcrições completas” são mencionadas nos detalhes do plano.

Há opção para usar meu próprio número de telefone?
A seção de preços afirma que você pode “pedir seu próprio número”, embora a disponibilidade exata dependa do plano escolhido.

Alternativas

  • Frameworks de bots apenas com texto (sem integração telefônica): Se o seu objetivo é principalmente automação baseada em chat (ex.: bots estilo Slack/Telegram), plataformas apenas com texto evitam telefonia e focam em fluxos baseados em mensagens.
  • Gateways de voz Call/SIP-para-webhook: Em vez de uma camada dedicada de “voz para bots”, equipes podem rotear chamadas de entrada/saída para webhooks ou servidores de aplicativos, implementando transcrição e TTS por conta própria.
  • APIs de speech-to-text + text-to-speech combinadas com telefonia: Outra abordagem é criar um app personalizado de chamadas telefônicas usando STT/TTS separados e um provedor de telefonia, oferecendo flexibilidade mas exigindo mais trabalho de integração.
  • Automação de voz unificada para contact center: Para organizações que buscam recursos mais amplos de call-center (roteamento, relatórios, assistência a agentes), ferramentas de automação de contact-center podem oferecer fluxos de voz além de uma integração “voz para bots” centrada em desenvolvedores.