ClawdTalk 是什麼?
ClawdTalk 是你現有「Clawdbot」(OpenClaw)的語音通話層,讓機器人能處理電話通話,而非僅限文字。你的機器人繼續接收與發送結構化訊息,而 ClawdTalk 則新增語音轉文字、文字轉語音,以及雙向通話,讓來電者能說話並聽到語音回覆。
核心目的是將你的機器人連接到真實電話通話:安裝技能、驗證號碼,然後像撥打電話線一樣致電 Clawdbot。通話可包含 PIN 保護,系統使用持續的出站 WebSocket 連線,而非需要公開暴露的閘道。
主要功能
- 雙向通話(bot 撥打電話與電話撥打 bot): 從電話號碼撥打你的機器人,或讓機器人說「call me」;兩向皆開箱即用。
- 語音轉文字與逐字稿: 來電者的語音會被轉錄,並將逐字稿作為機器人的文字輸入。
- 自然語音文字轉語音(Telnyx NaturalHD): 語音輸出使用「自然語音」的文字轉語音(列為 Telnyx 語音),目標是清晰、人類般的音訊。
- 伺服器端 PIN 保護: 設定 PIN 以拒絕未提供所需 PIN 的來電;來電者驗證由伺服器端強制執行。
- 基於 WebSocket 的私有連線: ClawdTalk 使用持續出站 WebSocket 連線,讓你的機器人無需公開暴露閘道;設計用於 NAT 與防火牆後方運作。
- HD 語音支援: 通話至機器人支援 HD Voice,使用 AMR-WB 編解碼器(寬頻品質)。
如何使用 ClawdTalk
- 連接你的 Clawdbot(OpenClaw)。 ClawdTalk 定位為與你的機器人並行的語音層。
- 安裝 ClawdTalk 技能 並 驗證你的號碼(網站描述為設定的一部分)。
- (建議)設定 PIN 保護。 註冊時建立 PIN 並設定通話存取規則。
- 開始致電你的機器人。 使用提供的電話號碼致電 Clawdbot,或使用機器人觸發的「call me」流程。
- 觀察通話逐字稿與機器人回應。 機器人接收通話事件(包含來電者文字)並回傳文字回應,轉為語音給來電者。
使用情境
- DevOps / 事件回應通話: 機器人可將來電者指令轉為動作(例如「回滾至上一個穩定版本並通知團隊」),並在同一次通話中讀回結果。
- 個人助理提醒與資訊查詢: 使用者可詢問時間相關或個人資料(例如讀取行事曆或睡眠分數),並接收語音摘要。
- 購物與結帳協助: 致電機器人新增雜貨訂單項目,並確認總額或配送時間。
- 智慧家庭控制: 要求機器人設定恆溫器目標、開關燈光、鎖門;機器人回以確認。
- 目前跨多聊天工具的團隊工作流程: 網站對比「無 ClawdTalk」(訊息散布多個應用程式)與單一通話工作流程,可提供結構化回應。
常見問題
ClawdTalk 為我的機器人新增什麼? ClawdTalk 新增語音通話功能—語音轉文字、文字轉語音,以及雙向電話通話—同時你的機器人繼續處理底層文字互動。
我需要將機器人暴露至公共網際網路嗎? 網站描述使用持續出站 WebSocket 連線,讓機器人保持私有且無需公開暴露閘道。
通話能否限制為授權來電者? 是的。ClawdTalk 支援 PIN 保護,由伺服器端強制執行以拒絕無所需 PIN 的通話。
來電者會收到逐字稿嗎? 描述的通話流程包含讀取逐字稿並將轉錄作為機器人輸入;「完整逐字稿」在方案細節中提及。
有使用自己電話號碼的選項嗎? 定價區塊表示你可以「訂購自己的號碼」,確切可用性取決於選擇的方案。
替代方案
- 純文字機器人框架(無電話整合): 如果你的目標主要是基於聊天自動化(例如 Slack/Telegram 風格的機器人),純文字平台可避免電話功能,專注於訊息驅動的工作流程。
- 來電/SIP 轉 webhook 語音閘道: 團隊可將來電/去電路由至 webhook 或應用程式伺服器,而非專用「機器人語音層」,自行實作轉錄與 TTS。
- 語音轉文字 + 文字轉語音 API 結合電話服務: 另一種方式是使用獨立的 STT/TTS 與電話供應商建置自訂電話應用程式,提供彈性但需更多整合工作。
- 統一聯絡中心語音自動化: 對於尋求更廣泛呼叫中心功能(路由、報表、代理輔助)的組織,聯絡中心自動化工具可提供超越開發者導向「機器人語音」整合的語音工作流程。
替代品
Lemon
Lemon AI 語音代理,將語音指令轉換為已完成的任務,管理訊息、研究、委派工作,無需切換應用程式。
OpenAI Realtime API
使用 OpenAI Realtime API 建立低延遲、多模態語音與即時音訊體驗,支援瀏覽器語音代理與 WebSocket 即時轉錄。
MiniCPM-o 4.5
MiniCPM-o 4.5 是一款功能強大的多模態人工智慧模型,專為視覺、語音和全雙工實時串流而設計,提供先進的視覺理解、語音合成和即時互動能力,架構緊湊,擁有9B參數。它融合多個先進的AI組件,如 SigLip2、Whisper-medium、CosyVoice2 和 Qwen3-8B,實現多任務的最先進性能。其核心目標是讓強大的多模態AI技術更易於普及,提供一個多功能、高效且易於使用的模型,適用於研究、開發和實際應用部署。
PXZ AI
一個集成圖像、視頻、語音、寫作和聊天工具的全能AI平台,以增強創造力和協作。
Gemma AI
Gemma AI 是一款智慧型應用程式,會直接透過個人化的智慧語音提醒來電通知您,確保您絕不會錯過重要的任務、約會或截止日期。
CAMB.AI
把單一直播轉成多語言同步廣播,支援 YouTube、Twitch、X 等;即時 AI 音訊配音,讓觀眾聽到翻譯解說。