Speech to Text Converter

Speech to Text Converter は、ブラウザで使える文字起こしツールです。ライブ音声入力や音声・動画ファイルのアップロードに対応し、短い作業向けの無料プランと、無制限の文字起こし、AI要約、翻訳、話者識別、詳細な書き出し機能を備えたProプランがあります。

AI音声認識

文字起こし

音声テキスト化

ウェブサイトを訪問

概要

Speech to Text Converter は、ライブ音声入力や音声・動画ファイルの変換に対応した、ブラウザベースの音声文字起こしツールです。OpenAI Whisper v3 Turbo を使って話された言葉をテキストに変換し、短い作業向けの無料プランと、より大きな文字起こし作業や定期的な文字起こし作業向けの有料 Pro プランを提供しています。

このサイトでは、素早いメモ作成、アップロードした録音の処理、要約・翻訳・字幕書き出し・話者識別などの文字起こし後作業を中心に製品を位置づけています。また、音声はサーバーに保存せず一時的に処理されるため、プライバシー重視の処理も強調しています。

主な機能

ライブ音声入力とファイルアップロード

ブラウザでライブ音声入力するか、音声・動画ファイルをアップロードして文字起こしできます。サイトでは、無料プランでは短いメモ、Proでは長い録音に対応すると案内しています。

多言語音声認識

自動言語検出は、料金ページでは90以上の言語、メインサイトでは45以上の言語に対応しており、多言語音声の文字起こしに向いています。

自動句読点と書式設定

句読点と書式を自動で追加し、間の取り方や文の区切りを自然に処理します。

AIによる文字起こし後ワークフロー

Proでは、文字起こし後の作業向けにAI要約、翻訳、チャットツールが使えます。

柔軟なエクスポートオプション

TXT、SRT、VTT、DOCX、PDFなどの形式で文字起こしをエクスポートでき、タイムスタンプ、話者名、段落の扱いを含むオプションがあります。

高度なPro機能

Proには、話者識別、優先処理、保存された文字起こし履歴、定期的なワークフロー向けのAPIアクセスが追加されます。

よくあるワークフロー

録音と長文コンテンツ
インタビュー、ポッドキャスト、講義の録音を、あとで検索・編集・共有できるテキストに変換します。
ライブ音声入力
入力より話すほうが速いときに、ブラウザの音声入力モードで素早くメモ、下書き、ボイスメモを作成します。
キャプションと字幕の作成
アップロードした音声または動画を SRT や VTT に書き出して、字幕ファイルを作成します。
文字起こしの分析と後続作業
AI で文字起こしを確認し、要点、要約、アクション項目、言語翻訳を抽出します。
継続的な文字起こしワークフロー
話者識別と文字起こし履歴を使って、繰り返し発生する業務向けの文字起こし作業に対応します。

Pros and Cons

Pros

無料プランではサインアップなしでブラウザ上で使えます。
ライブ音声入力と、アップロードした音声・動画ファイルの両方に対応しています。
文字起こしの要約、翻訳、内容に関する質問に使えるAIツールが含まれています。
Proでは字幕形式や文書形式を含む複数の書き出し形式を利用できます。
一時的な処理とHTTPSまたはSSL暗号化を重視しています。

Cons

無料プランは短い利用向けに制限されており、主にテストや簡単なメモ作成を想定しています。
高度な書き出し、話者識別、APIアクセスはProに含まれます。
チーム向け機能は、広く提供されるプランというより優先アクセスとして案内されています。

FAQ

無料プランはありますか？また、何に使うものですか？

はい。無料プランは軽い利用や短いファイル向けで、1日あたりの文字起こし時間とAI呼び出し回数に制限があります。サイトによると、Proではこれらの1日ごとの制限が解除されます。

どのファイル形式を文字起こしできますか？

サイトによると、MP3、M4A、WAV、OGG、FLAC、AAC、WMA、MP4、MOV、WebM、AVI、MKVなど、主要な音声・動画形式に対応しています。

どのような出力形式がありますか？

無料プランではTXTとして文字起こしを出力でき、ProではSRT、VTT、DOCX、PDFの書き出しオプションが追加されます。

Proは無料プランと比べて何が追加されますか？

料金ページによると、Proには無制限の文字起こし、無制限のAI呼び出し、最大500 MBのファイル、話者識別、優先処理、保存された文字起こし履歴、APIアクセスが含まれます。

データはどのように扱われますか？

サイトによると、音声は一時的に処理され、録音データはサーバーに保存されず、転送にはHTTPSまたはSSL暗号化が使われます。

Quick Facts

カテゴリ: 音声認識 / 文字起こし
プラットフォーム: Webアプリ
主な用途: 話した音声をテキストに変換し、文字起こしを出力する
ソースドメイン: speech-to-text.co
主なワークフロー: ライブ音声入力、音声文字起こし、字幕、要約、翻訳