ClawdTalk
Dê voz ao seu Clawdbot: ClawdTalk adiciona chamadas de telefone bidirecionais com speech-to-text, transcrições e text-to-speech, com PIN opcional.
O que é ClawdTalk?
ClawdTalk é uma camada de chamadas de voz para o seu Clawdbot existente (OpenClaw) que permite que um bot gerencie chamadas telefônicas em vez de apenas texto. Seu bot continua recebendo e enviando mensagens estruturadas, enquanto o ClawdTalk adiciona speech-to-text, text-to-speech e chamadas bidirecionais para que os chamadores possam falar e ouvir respostas faladas.
O propósito principal é conectar seu bot a chamadas telefônicas reais: você instala a skill, verifica um número e depois liga para o seu Clawdbot como uma linha telefônica. As chamadas podem incluir proteção por PIN, e o sistema usa uma conexão WebSocket de saída persistente em vez de exigir um gateway exposto publicamente.
Principais Recursos
- Chamadas bidirecionais (bot-para-telefone e telefone-para-bot): Ligue para o seu bot de um número de telefone ou peça ao seu bot “me ligue”; ambas as direções funcionam de imediato.
- Speech-to-text com transcrições: A fala do chamador é transcrita e a transcrição é usada como entrada de texto do bot.
- Text-to-speech com som natural (Telnyx NaturalHD): A saída de voz é gerada com text-to-speech “de som natural” (listado como vozes Telnyx), visando áudio claro e humano.
- Proteção por PIN no lado do servidor: Defina um PIN para rejeitar chamadas que não apresentem o PIN exigido; a validação do chamador é aplicada no servidor.
- Conexão privada baseada em WebSocket: O ClawdTalk usa uma conexão WebSocket de saída persistente para que seu bot não precise de um gateway exposto publicamente; é projetado para funcionar atrás de NAT e firewalls.
- Suporte a voz HD: As chamadas para o bot suportam Voz HD usando codec AMR-WB (qualidade wideband).
Como Usar o ClawdTalk
- Conecte seu Clawdbot (OpenClaw). O ClawdTalk se posiciona como a camada de voz que fica ao lado do seu bot.
- Instale a skill ClawdTalk e verifique seu número (o site descreve isso como parte da configuração).
- (Recomendado) Configure proteção por PIN. Durante o cadastro, você define o PIN e as regras de acesso às chamadas.
- Comece a ligar para o seu bot. Use o número de telefone fornecido para ligar para o Clawdbot, ou use um fluxo “me ligue” acionado pelo seu bot.
- Observe transcrições de chamadas e respostas do bot. O bot recebe eventos de chamada (incluindo o texto do chamador) e envia de volta uma resposta de texto que é falada para o chamador.
Casos de Uso
- Chamadas DevOps / resposta a incidentes: Um bot pode traduzir um comando de um chamador em uma ação (ex.: “faça rollback para a última versão estável e notifique a equipe”) e ler o resultado na mesma chamada.
- Lembretes e consulta de informações de assistente pessoal: Usuários podem pedir dados baseados em tempo ou pessoais (ex.: ler calendário ou pontuação de sono) e receber um resumo falado.
- Assistência em compras e checkout: Ligue para o seu bot para adicionar itens a um pedido de supermercado e confirmar totais ou horários de entrega.
- Controle de casa inteligente: Peça ao bot para definir metas de termostato, ligar/desligar luzes e trancar portas; o bot responde com confirmações.
- Fluxos de equipe que atualmente abrangem múltiplas ferramentas de chat: O site contrasta “sem” ClawdTalk (mensagens espalhadas por vários apps) com um fluxo de chamada único que pode entregar uma resposta estruturada.
FAQ
O que o ClawdTalk adiciona ao meu bot?
O ClawdTalk adiciona capacidades de chamadas de voz — speech-to-text, text-to-speech e chamadas telefônicas bidirecionais — enquanto seu bot continua gerenciando as interações de texto subjacentes.
Preciso expor meu bot à internet pública?
O site descreve o uso de uma conexão WebSocket de saída persistente para manter o bot privado e evitar a necessidade de um gateway exposto publicamente.
As chamadas podem ser restritas a chamadores autorizados?
Sim. O ClawdTalk suporta proteção por PIN, com aplicação no lado do servidor para rejeitar chamadas sem o PIN exigido.
Os chamadores recebem transcrições?
O fluxo de chamada descrito inclui ler a transcrição e usar a transcrição como entrada do bot; “transcrições completas” são mencionadas nos detalhes do plano.
Há opção para usar meu próprio número de telefone?
A seção de preços afirma que você pode “pedir seu próprio número”, embora a disponibilidade exata dependa do plano escolhido.
Alternativas
- Frameworks de bots apenas com texto (sem integração telefônica): Se o seu objetivo é principalmente automação baseada em chat (ex.: bots estilo Slack/Telegram), plataformas apenas com texto evitam telefonia e focam em fluxos baseados em mensagens.
- Gateways de voz Call/SIP-para-webhook: Em vez de uma camada dedicada de “voz para bots”, equipes podem rotear chamadas de entrada/saída para webhooks ou servidores de aplicativos, implementando transcrição e TTS por conta própria.
- APIs de speech-to-text + text-to-speech combinadas com telefonia: Outra abordagem é criar um app personalizado de chamadas telefônicas usando STT/TTS separados e um provedor de telefonia, oferecendo flexibilidade mas exigindo mais trabalho de integração.
- Automação de voz unificada para contact center: Para organizações que buscam recursos mais amplos de call-center (roteamento, relatórios, assistência a agentes), ferramentas de automação de contact-center podem oferecer fluxos de voz além de uma integração “voz para bots” centrada em desenvolvedores.
Alternativas
Lemon
Lemon: agente de IA que transforma comandos de voz em tarefas concluídas. Gerencie mensagens, pesquise e delegue sem trocar de app.
OpenAI Realtime API
Crie experiências de voz multimodais e em tempo real com baixa latência usando a OpenAI Realtime API, incluindo agentes de voz no navegador e transcrição.
MiniCPM-o 4.5
MiniCPM-o 4.5 é um modelo de IA multimodal altamente capaz, projetado para visão, fala e transmissão ao vivo full-duplex, oferecendo compreensão visual avançada, síntese de fala e capacidades interativas em tempo real, em uma arquitetura compacta de 9 bilhões de parâmetros.
PXZ AI
Uma plataforma de IA tudo-em-um que combina ferramentas para imagem, vídeo, voz, escrita e chat para melhorar a criatividade e a colaboração.
Gemma AI
Gemma AI é um aplicativo inteligente que liga diretamente para você com lembretes de voz personalizados e inteligentes para garantir que você nunca perca tarefas importantes, compromissos ou prazos.
CAMB.AI
Transforme um único live stream em uma transmissão multilíngue com dublagem de áudio por IA em tempo real para YouTube, Twitch e X.