ClawdTalk
Dai una voce al tuo Clawdbot: ClawdTalk aggiunge chiamate bidirezionali con speech-to-text, trascrizioni e text-to-speech, con PIN opzionale.
Cos'è ClawdTalk?
ClawdTalk è un livello di chiamate vocali per il tuo esistente “Clawdbot” (OpenClaw) che permette a un bot di gestire chiamate telefoniche invece di solo testo. Il tuo bot continua a ricevere e inviare messaggi strutturati, mentre ClawdTalk aggiunge speech-to-text, text-to-speech e chiamate bidirezionali così che i chiamanti possano parlare e ascoltare risposte vocali.
Lo scopo principale è collegare il tuo bot a vere chiamate telefoniche: installi la skill, verifichi un numero e poi chiami il tuo Clawdbot come una linea telefonica. Le chiamate possono includere protezione PIN, e il sistema usa una connessione WebSocket outbound persistente invece di richiedere un gateway esposto pubblicamente.
Caratteristiche Principali
- Chiamate bidirezionali (bot-telefono e telefono-bot): Chiama il tuo bot da un numero di telefono o chiedi al tuo bot “chiamami”; entrambe le direzioni funzionano subito.
- Speech-to-text con trascrizioni: Il discorso del chiamante viene trascritto e la trascrizione è usata come input testuale del bot.
- Text-to-speech dal suono naturale (Telnyx NaturalHD): L'output vocale è generato con text-to-speech “dal suono naturale” (voci Telnyx), per un audio chiaro e simile a quello umano.
- Protezione PIN lato server: Imposta un PIN per rifiutare chiamate senza il PIN richiesto; la validazione del chiamante è applicata lato server.
- Connessione privata basata su WebSocket: ClawdTalk usa una connessione WebSocket outbound persistente così il tuo bot non ha bisogno di un gateway esposto pubblicamente; è progettato per funzionare dietro NAT e firewall.
- Supporto voce HD: Le chiamate al bot supportano HD Voice con codec AMR-WB (qualità wideband).
Come Usare ClawdTalk
- Collega il tuo Clawdbot (OpenClaw). ClawdTalk si posiziona come il livello vocale che affianca il tuo bot.
- Installa la skill ClawdTalk e verifica il tuo numero (descritto come parte della configurazione).
- (Consigliato) Configura la protezione PIN. Durante l'iscrizione, imposti il PIN e definisci le regole di accesso alle chiamate.
- Inizia a chiamare il tuo bot. Usa il numero di telefono fornito per chiamare il tuo Clawdbot, o usa un flusso “chiamami” attivato dal tuo bot.
- Osserva trascrizioni delle chiamate e risposte del bot. Il bot riceve eventi di chiamata (inclusi il testo del chiamante) e invia una risposta testuale che viene letta al chiamante.
Casi d'Uso
- Chiamate DevOps / risposta incidenti: Un bot può tradurre un comando dal chiamante in un'azione (es. “ripristina l'ultima release stabile e notifica il team”) e poi leggere il risultato nella stessa chiamata.
- Promemoria e ricerca info assistente personale: Gli utenti possono chiedere dati temporali o personali (es. lettura calendario o punteggio sonno) e ricevere un riassunto vocale.
- Assistenza acquisti e checkout: Chiama il tuo bot per aggiungere articoli a un ordine della spesa e confermare totali o tempi di consegna.
- Controllo casa intelligente: Chiedi al bot di impostare target termostato, accendere/spegnere luci e chiudere porte; il bot risponde con conferme.
- Workflow di team che ora attraversano più tool di chat: Il sito contrappone “senza” ClawdTalk (messaggi sparsi su più app) a un unico workflow di chiamata che può fornire una risposta strutturata.
FAQ
Cosa aggiunge ClawdTalk al mio bot?
ClawdTalk aggiunge capacità di chiamate vocali — speech-to-text, text-to-speech e chiamate telefoniche bidirezionali — mentre il tuo bot continua a gestire le interazioni testuali sottostanti.
Devo esporre il mio bot su internet pubblico?
Il sito descrive l'uso di una connessione WebSocket outbound persistente per mantenere il bot privato e evitare un gateway esposto pubblicamente.
Le chiamate possono essere limitate a chiamanti autorizzati?
Sì. ClawdTalk supporta protezione PIN, con enforcement lato server per rifiutare chiamate senza il PIN richiesto.
I chiamanti ricevono trascrizioni?
Il flusso di chiamata descritto include la lettura della trascrizione e l'uso della trascrizione come input del bot; si fa riferimento a “trascrizioni complete” nei dettagli del piano.
C'è l'opzione per il mio numero di telefono?
La sezione prezzi indica che puoi “ordinare il tuo numero”, anche se la disponibilità esatta dipende dal piano scelto.
Alternative
- Framework per bot solo testuali (senza integrazione telefonica): Se il tuo obiettivo è principalmente l'automazione basata su chat (es. bot in stile Slack/Telegram), le piattaforme solo testuali evitano la telefonia e si concentrano su flussi di lavoro basati su messaggi.
- Gateway vocali Call/SIP-to-webhook: Invece di un “livello vocale per bot” dedicato, i team possono instradare chiamate in entrata/uscita verso webhook o server applicativi, implementando poi trascrizione e TTS autonomamente.
- API Speech-to-text + text-to-speech combinate con telefonia: Un altro approccio consiste nel creare un'app personalizzata per chiamate telefoniche usando STT/TTS separati e un provider di telefonia, offrendo flessibilità ma richiedendo più lavoro di integrazione.
- Automazione vocale unificata per contact center: Per organizzazioni che cercano funzionalità più ampie per call-center (routing, reporting, assistenza agente), gli strumenti di automazione contact-center possono offrire flussi di lavoro vocali oltre a un'integrazione “voce bot” orientata agli sviluppatori.
Alternative
Lemon
Lemon è un agente AI che trasforma comandi vocali in attività completate, gestendo messaggi, ricerche e delegando lavoro senza cambiare app.
OpenAI Realtime API
Con OpenAI Realtime API crea esperienze vocali e audio in tempo reale a bassa latenza, multimodali, con agenti vocali web e trascrizione realtime.
MiniCPM-o 4.5
MiniCPM-o 4.5 è un modello di intelligenza artificiale multimodale altamente performante, progettato per visione, parlato e streaming live a doppio senso, offrendo avanzate capacità di comprensione visiva, sintesi vocale e interattività in tempo reale in un'architettura compatta con 9 miliardi di parametri.
PXZ AI
Una piattaforma AI tutto in uno che combina strumenti per immagini, video, voce, scrittura e chat per migliorare la creatività e la collaborazione.
Gemma AI
Gemma AI è un'applicazione intelligente che ti chiama direttamente con promemoria vocali personalizzati e intelligenti per assicurarti di non perdere mai attività importanti, appuntamenti o scadenze.
CAMB.AI
CAMB.AI trasforma un singolo live in una trasmissione multilingue con doppiaggio audio AI in tempo reale per YouTube, Twitch e X.