UStackUStack
ClawdTalk favicon

ClawdTalk

ClawdTalk cierra la brecha entre los bots basados en texto (como los creados con OpenClaw) y la comunicación de voz del mundo real, permitiendo a los usuarios llamar a sus bots como si fuera una llamada telefónica.

ClawdTalk

¿Qué es ClawdTalk?

¿Qué es ClawdTalk?

ClawdTalk es una capa de integración de voz innovadora diseñada para dar a sus bots existentes de manejo de texto una interfaz de voz natural y conversacional. Si bien los bots modernos sobresalen en el procesamiento de comandos de texto a través de plataformas como Telegram o Slack, a menudo carecen de la inmediatez y accesibilidad de una llamada telefónica tradicional. ClawdTalk resuelve esto al permitir a los usuarios marcar un número y hablar directamente con su bot. El sistema gestiona la compleja pila de telefonía: convierte el habla en texto para el bot y convierte la respuesta de texto del bot de nuevo en voz de sonido natural para el usuario.

Este servicio transforma la forma en que los usuarios interactúan con la automatización. En lugar de escribir comandos largos o navegar por interfaces de aplicaciones complejas, los usuarios pueden simplemente hablar con su asistente de IA, haciendo que tareas complejas —como revertir un despliegue de producción o verificar una puntuación de sueño— sean tan simples como una única conversación telefónica. ClawdTalk abstrae la necesidad de experiencia profunda en telefonía, ofreciendo una arquitectura fluida de cuatro cajas que conecta su bot directamente a la red de voz global a través de una conexión WebSocket segura.

Características Principales

  • Llamadas de Voz Bidireccionales: Inicie llamadas a su bot desde cualquier teléfono estándar, o indique a su bot que le llame a usted. Se admiten llamadas entrantes y salientes listas para usar.
  • Voces de Sonido Natural: Utiliza tecnología de Voz a Texto (STT) y Texto a Voz (TTS) de primer nivel (como las voces de Telnyx) para garantizar que las respuestas suenen humanas, minimizando artefactos robóticos y latencia.
  • Conexión WebSocket Segura: Mantiene una conexión WebSocket persistente y saliente entre su bot y ClawdTalk. Esto garantiza la privacidad y seguridad, ya que su bot no requiere una puerta de enlace expuesta públicamente y puede operar de forma segura detrás de NATs o firewalls.
  • Protección con PIN: Característica de seguridad opcional pero muy recomendada que requiere que las personas que llaman ingresen un PIN (validado en el servidor) antes de conectarse al bot, evitando el acceso no autorizado.
  • Soporte de Voz HD: Aprovecha las capacidades modernas de la red móvil para ofrecer una calidad de audio nítida y de banda ancha, asegurando alta fidelidad en la comunicación.
  • Registro Completo de Transcripciones: Proporciona transcripciones completas de cada interacción de voz, ofreciendo un registro de auditoría para depuración y revisión.

Cómo Usar ClawdTalk

Comenzar con ClawdTalk implica un proceso de configuración sencillo centrado en conectar su infraestructura de bot existente:

  1. Instalar la Habilidad/Conectar: Integre la habilidad ClawdTalk o ejecute el script de conexión proporcionado (ejemplo: ./scripts/connect.sh start) para establecer el enlace WebSocket seguro a la red ClawdTalk.
  2. Verificar Identidad: Durante la configuración, verificará su número de teléfono y establecerá un PIN de acceso seguro.
  3. Comenzar a Llamar: Una vez conectado, puede llamar a su número dedicado (o al número de demostración compartido, 301-MY-CLAWD) desde cualquier teléfono. El sistema convierte instantáneamente su voz en un mensaje JSON estructurado que su bot recibe.
  4. El Bot Responde: Su bot procesa la entrada de texto y envía una respuesta de texto de vuelta a través del WebSocket. ClawdTalk convierte este texto en voz natural y se lo reproduce durante la llamada.

Este proceso no requiere cambios en la lógica central de su bot; simplemente trata la entrada de voz como otro mensaje de texto.

Casos de Uso

ClawdTalk desbloquea potentes interfaces conversacionales en varios dominios:

  • Desarrollo de Software y DevOps: Los desarrolladores pueden llamar a su bot de despliegue para verificar el estado de las canalizaciones, iniciar reversiones para comprobaciones de estado fallidas o solicitar resúmenes de registros recientes, todo con manos libres mientras trabajan en tareas físicas.
  • Monitoreo de Salud y Bienestar: Los usuarios pueden consultar datos personales de salud, como solicitar su puntuación de sueño Oura de anoche o pedir un resumen de las lecturas biométricas, sin necesidad de abrir una aplicación específica.
  • Automatización del Hogar Inteligente: Controle dispositivos conectados con manos libres. Por ejemplo, un usuario puede llamar a su bot de automatización del hogar para apagar luces, ajustar el termostato o cerrar puertas mientras cocina o lleva objetos.
  • Comercio Electrónico y Asistentes Personales: Administre rápidamente listas de compras, verifique el estado de los pedidos o programe entregas simplemente llamando al bot asistente y dictando los cambios.

Preguntas Frecuentes

P: ¿Necesito cambiar el código de mi bot de texto existente? A: No. ClawdTalk está diseñado para ser transparente. Su bot recibe mensajes JSON estándar que contienen el texto transcrito y envía respuestas de texto. El manejo de voz es gestionado completamente por la infraestructura de ClawdTalk.

P: ¿Qué tan segura es la conexión? A: La seguridad es una prioridad. Las llamadas están protegidas por una validación de PIN opcional en el servidor. Además, la conexión entre su bot y ClawdTalk utiliza un WebSocket privado y persistente, lo que evita la necesidad de puntos finales expuestos públicamente.

P: ¿Cuáles son las opciones de precios? A: ClawdTalk ofrece un nivel Gratuito perfecto para pruebas, que incluye minutos y textos mensuales limitados. Los niveles de pago (Starter y Pro) ofrecen mayor capacidad, grabaciones de llamadas (próximamente) y la opción de registrar su propio número de teléfono dedicado.

P: ¿Puedo usar mi propio número de teléfono? A: Sí. Los planes de pago le permiten solicitar su propio número dedicado por una tarifa de configuración única, asegurando que las llamadas estén marcadas con su servicio.

P: ¿Qué tipo de calidad de audio puedo esperar? A: El servicio admite Voz HD (códec de banda ancha) a través de redes móviles, lo que resulta en una comunicación nítida que suena significativamente más natural que la telefonía comprimida tradicional.