UStackUStack
Lightning TTS v3 icon

Lightning TTS v3

Lightning TTS v3 是 Smallest.ai 最小延遲文字轉語音 API,支援多語言語音與聲音複製,適用語音代理與製作音訊。註冊送 $10 免費額度。

Lightning TTS v3

Lightning TTS v3 是什麼?

Lightning TTS v3 是 Smallest.ai 的文字轉語音 (TTS) API,用於即時與製作音訊工作流程產生語音。專為支援語音代理對話、助理式互動及長篇敘述設計,具低首音延遲與多語言語音輸出。

本頁亦介紹 Lightning 的聲音複製功能,使用者可從上傳樣本產生聲音複製並大規模部署。主要目標是協助團隊製作一致的對話語音與複製聲音,用於代理、播客及本地化內容等應用。

主要功能

  • 即時低延遲(首音時間 100ms):適用互動情境,音訊需快速啟動。
  • 多語言語音與自動偵測(15 種語言,持續新增):涵蓋歐洲與印度語言,包括 English、Spanish、Hindi、Tamil、French、German、Italian、Portuguese、Swedish、Dutch、Telugu、Malayalam、Kannada、Marathi 及 Gujarati。
  • 句子中適應性多語言語碼混合:支援單一發語中無縫切換。
  • 數秒內聲音複製:上傳短樣本後不到 10 秒完成複製並準備部署。
  • 大規模即時(20+ 並行串流):維持低延遲同時處理多重音訊串流。
  • 製作導向音訊輸出:強調廣播級品質,適用播客、有聲書及遊戲角色。

如何使用 Lightning TTS v3

  1. 註冊 即獲 $10 免費額度
  2. 從 TTS API 開始,用於對話或長篇文字轉語音產生。
  3. 聲音複製工作流程中,上傳樣本 並使用產生的複製聲音進行後續音訊產生。
  4. 若規劃高並行度(本頁提及 20+ 並行串流),請依 API 即時行為設計應用。

文件在本頁參照(「View Docs」),網站亦提供直接試用產品方式。

使用情境

  • 擬人語音代理對話支援:產生助理式語音,用於客戶支援互動,快速音訊啟動至關重要。
  • 互動應用與遊戲角色語音:製作具情感範圍的動態角色語音,用於即時體驗。
  • 有聲書與長篇敘述:建立自然韻律與節奏的延長敘述,用於聆聽體驗。
  • 媒體製作(播客、廣告、開場及完整集數):產生廣播式片段與長內容語音。
  • 本地化與多語言語音內容:跨 15 種支援語言建立原生語音,必要時支援句子中語碼混合。
  • 聲音複製用於一致角色或品牌語音:上傳聲音樣本產生複製聲音(不到 10 秒),供重複製作使用。

常見問題

Lightning TTS v3.1 支援多少語言?

Lightning TTS v3.1 支援 15 種語言,持續新增。本頁列出強大涵蓋,包括 English、Spanish、Hindi、Tamil,以及歐洲語言(French、German、Italian、Portuguese、Swedish、Dutch)與印度語言(Hindi、Tamil、Telugu、Malayalam、Kannada、Marathi、Gujarati)。

聲音複製需時多久?需要多少音訊?

本頁指出,上傳樣本後 不到 15 秒音訊 即可完成聲音複製(製作就緒複製需 不到 10 秒)。

即時應用預期延遲為何?

本頁表示 Lightning v3.1 提供 首音時間低於 100ms,定位為即時應用的預設行為。

使用計費方式為何?有免費額度嗎?

註冊即獲 $10 免費額度。之後為 按使用量計費(依實際使用付費)。超大規模或高並行度,本頁提及可透過銷售取得 客製企業方案

替代方案

  • 其他具神經聲音的文字轉語音 API:當您需要應用程式或內容的一般 TTS 輸出時使用,但可能需比較延遲、語言涵蓋範圍,以及是否支援聲音複製。
  • 聲音複製解決方案(獨立或基於 API):若主要需求是複製而非對話導向 TTS,則考慮;工作流程可能更注重樣本準備與管理複製聲音資產。
  • 具多語言語音合成平台:檢視專注本地化與程式碼混合語音的供應商;比較其語言偵測行為及句子中途切換處理方式。
  • 即時串流 TTS 供應商:若主要需求是互動音訊啟動時間與並行串流,則比較串流支援與文件化的並行特性。
Lightning TTS v3 | UStack