Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS 是 Google 的預覽版文字轉語音模型，可生成富有表現力的 AI 語音，並細緻控制風格與呈現方式。支援 Gemini API、Google AI Studio、Vertex AI 與 Google Vids。

AI語音合成

文字轉語音

訪問網站

概覽

Gemini 3.1 Flash TTS 是 Google 的文字轉語音模型，可生成富有表現力的 AI 語音，並更精細地控制音訊聽起來的方式。發布公告強調了更好的自然度、更清楚的節奏控制，以及新的音訊標籤，讓開發者能透過自然語言指示來引導語音風格與呈現方式。

此模型正以預覽版逐步向開發者透過 Gemini API 與 Google AI Studio 開放，向企業透過 Vertex AI 開放，並向 Workspace 使用者透過 Google Vids 開放。它支援 70+ 種語言、原生多說話者對話，以及每個生成音訊輸出的 SynthID 浮水印。

功能

提升的語音品質

此模型被介紹為 Google 迄今最自然且最具表現力的文字轉語音模型，並具備更好的語音品質與可控性。

細緻的音訊標籤

Audio tags 可讓使用者透過嵌入在文字輸入中的自然語言指示，引導語音風格、速度、呈現方式、語氣與口音。

Studio 導向的表現控制

Google AI Studio 新增可設定的控制項，包含場景指導、說話者層級的細節指定與 inline tags，協助開發者塑造多輪表現。

無縫匯出為 API code

開發者可以將 Google AI Studio 中的精確語音參數匯出為 Gemini API code，以便在不同專案與平台間一致重用。

多說話者與多語言支援

此模型支援原生多說話者對話與 70+ 種語言，因此適合用於在地化與對話式語音體驗。

SynthID 浮水印

所有生成的音訊都會以 SynthID 加上浮水印，以支援 AI 生成內容的偵測。

使用情境

開發者語音應用
建立需要可控呈現方式的合成語音應用，例如角色配音、旁白體驗或互動式助理。
語音工作流程原型設計
在 Google AI Studio 中原型化語音體驗，利用標籤與註記調整節奏與語氣，並將結果設定匯出到 Gemini API code。
多語言內容製作
為跨多種語言的受眾建立在地化語音體驗，同時維持一致的風格與口音控制。
Workspace 影片旁白
當你需要為 Workspace 媒體工作流程提供 AI 生成語音時，可在 Google Vids 中使用此模型。
帶浮水印的合成音訊
當你需要可偵測的 AI 生成語音以便更安全地散布時，可生成內建 SynthID 浮水印的音訊。

Pros and Cons

Pros

可透過音訊標籤細緻控制語音風格、節奏、語氣與口音。
支援 70+ 種語言與原生多說話者對話。
可將 Studio 設定匯出為 Gemini API code，便於重複使用的工作流程。
所有生成音訊都包含 SynthID 浮水印。
可在多個 Google 介面使用，包括 Gemini API、Google AI Studio、Vertex AI 與 Google Vids。

Cons

來源未包含價格、方案限制或按地區提供的可用性細節。
進階控制功能主要來自發布公告的描述，可能需要實際測試才能評估其在特定工作流程中的表現。

FAQ

Gemini 3.1 Flash TTS 在哪裡可用？

它正以預覽版形式，透過 Gemini API 與 Google AI Studio 提供給開發者，透過 Vertex AI 提供給企業，並透過 Google Vids 提供給 Workspace 使用者。

它支援多少種語言？

公告指出它支援 70+ 種語言，並包含原生多說話者對話。

它提供開發者哪些語音輸出控制？

開發者可在 Google AI Studio 中使用 audio tags、Audio Profiles、Director’s Notes 與 inline tags 來引導語音風格、節奏、呈現方式、口音與說話者表達，之後再將相同參數匯出為 Gemini API code。

生成的音訊有浮水印嗎？

Gemini 3.1 Flash TTS 產生的所有音訊都會以 SynthID 加上浮水印，這被描述為一種不可感知、用於偵測 AI 生成音訊的浮水印。

價格是多少？

來源未提供產品頁上的價格細節，而研究集中連結的定價頁面是 404。

Quick Facts

類別: AI 語音 / 文字轉語音
主要使用者: 開發者、企業與 Workspace 使用者
可用性: 預覽版逐步開放
平台: Gemini API、Google AI Studio、Vertex AI、Google Vids
語言: 70+ 種語言
浮水印: SynthID