HypeScribe: KI-Transkription für Audio/Video. Präzise Texte, Zusammenfassungen, Einblicke & Kollaboration. Jetzt testen!
Die OpenAI Realtime API ermöglicht latenzarme, multimodale Kommunikation für die Entwicklung von Anwendungen wie Sprachagenten und unterstützt Sprache-zu-Sprache, Audio-/Bild-/Texteingaben sowie Audio-/Textausgaben.
Zavi AI ist eine fortschrittliche Spracheingabetastatur, die natürliche Sprache sofort in klaren, professionellen Text umwandelt und dabei automatisch Füllwörter entfernt und die Grammatik in allen Anwendungen korrigiert.
Dictato ist eine private, geräteinterne Diktier-App für den Mac, die Sprache mithilfe der Engines Whisper, Parakeet oder Apple sofort in Text über alle Anwendungen hinweg umwandelt.
Thinklet ist eine KI-gestützte, sprachgesteuerte Notiz-App, die gesprochene Gedanken sofort in organisierte Notizen transkribiert und es Benutzern ermöglicht, lokal auf dem Gerät mit ihrer Wissensdatenbank zu chatten.
Willow Voice ist eine intelligente, kontextbewusste KI-Spracherkennungssoftware für Mac, Windows und iOS, die entwickelt wurde, um die Produktivität zu steigern, indem sie natürliche Sprache sofort in perfekten Text umwandelt.
闪电说 AI 语音输入法 ist ein primär auf dem Endgerät basierendes KI-Spracheingabetool, das behauptet, viermal schneller als herkömmliches Tippen zu sein, und bietet eine Reaktion im Millisekundenbereich sowie eine leistungsstarke KI-gestützte automatische Korrektur, die in allen Anwendungen unterstützt wird.
ClawdTalk schlägt die Brücke zwischen textbasierten Bots (wie denen, die mit OpenClaw erstellt wurden) und der realen Sprachkommunikation, sodass Benutzer ihre Bots wie einen normalen Anruf tätigen können.
Ein kostenloses Online-Tool, das Audio- und Videodateien in präzise Texttranskripte in über 45 Sprachen umwandelt. Es unterstützt zahlreiche Dateiformate und erfordert keine Downloads oder Anmeldungen.
MiniCPM-o 4.5 ist ein äußerst leistungsfähiges multimodales KI-Modell, das für Vision, Sprache und voll-duplex Live-Streaming entwickelt wurde. Es bietet fortschrittliches visuelles Verständnis, Sprachsynthese und Echtzeit-Interaktivitätsfähigkeiten in einer kompakten Architektur mit 9 Milliarden Parametern.
Voxtral ist eine hochentwickelte Sprach-zu-Text-Lösung von Mistral AI, die darauf ausgelegt ist, präzise, Echtzeit- und Batch-Transkriptionsdienste zu liefern. Sie nutzt modernste Modelle, um branchenführende Transkriptionsqualität, Sprecherdiarisierung und eine Verarbeitung mit geringer Latenz zu gewährleisten, was sie für eine Vielzahl von sprachgesteuerten Anwendungen geeignet macht. Das Angebot umfasst sowohl Batch- als auch Live-Transkriptionsmodelle, die für unterschiedliche Anwendungsfälle optimiert sind, und ist mit Blick auf Datenschutz und Effizienz entwickelt.

Ihr persönlicher KI-Assistent erinnert sich an alles, was Sie sehen, sagen und hören. Kostenlos, Open Source, 100% lokal.

Voice Anywhere ist ein sofortiges Diktierwerkzeug für macOS, das Ihre Sprache sofort in Text in jeder Anwendung umwandelt.
Sayline ist die produktivste Art zu tippen und ermöglicht es den Benutzern, Texte schnell und effizient mit leistungsstarker KI-Diktiertechnologie zu diktieren.
TalkMirror ist ein professionelles Sprachfeedback-Tool, das für Sprachlerner, öffentliche Redner und Schauspieler entwickelt wurde und sofortige Selbstkorrektur durch Sprachreflexion bietet.
Qlay bietet KI-gestützte Aufsicht für transparente Bewertungsprozesse.

Konvertieren Sie Sprache mühelos in Text mit der Chrome-Erweiterung von BlabbyAI.
Poised ist ein KI-gestützter Kommunikationscoach, der Echtzeit-Feedback bietet, um Ihnen zu helfen, während Anrufen selbstbewusst zu sprechen.
KI-gestützter Transkriptionsdienst, der Audio- und Videodateien in Text umwandelt.
AIMIX智剪 ist eine intelligente Videobearbeitungssoftware, die eine schnelle Batch-Produktion von originellen Kurzvideos ermöglicht und KI für Funktionen wie automatische Untertitelgenerierung und Sprachsynthese nutzt.