Wir helfen Unternehmen seit 18 Jahren,
bessere Software zu finden

Text-To-Speech Software

Mit Text-to-Speech-Software (Text zu Sprache) können Nutzende schriftliche Texte per künstlicher Sprachausgabe vorlesen lassen, um Inhalte barrierefrei zugänglich zu machen und die Interaktion mit Inhalten zu verbessern. Nutzende können mit integrierten KI-Funktionen natürlich klingende Stimmen erzeugen lassen oder eigene Stimmen erstellen.

18 Ergebnisse
Twilio bietet einfache umlagebasierte APIs für Unternehmen, mit denen skalierbare, zuverlässige Sprach- und SMS-Apps für das Web oder mobile Geräte erstellt werden können.
Twilio ist die laut Hersteller weltweit führende Cloud-Kommunikationsplattform, mit der du Kunden über kanalübergreifend ansprechen kannst – d. h. per SMS, Sprache, Video, E-Mail, WhatsApp und mehr. Umlagebasierte APIs ermöglichen es Unternehmen, ihre Kommunikation zuverlässig zu skalieren. Erfahre mehr über Twilio

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
InVideo hilft dir dabei, deine Inhalte in großartige Videos umzuwandeln.
InVideo hilft dir dabei, deine Inhalte in großartige Videos umzuwandeln. Die Anwendung unterstützt Medienunternehmen, kleine Unternehmen und Marken dabei, das Engagement des Publikums durch die Einflusskraft von Videoinhalten zu steigern. Diese Plattform ist ideal für Vermarkter*innen, Verlage, Einzelpersonen und Agenturen, um ihre Strategie für Markeninhalte auf die nächste Ebene zu heben. Das Unternehmen beschäftigt ein hochmotiviertes Team, das stolz darauf ist, einen außergewöhnlichen Kundenservice zu bieten. Die Zukunft von Content liegt bei InVideo. Erfahre mehr über InVideo

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Fliki ist ein Text-to-Speech und Text-to-Video-Konverter, mit dem du Audio- und Videoinhalte mit KI-Stimmen in weniger als einer Minute erstellen kannst.
Fliki ist ein Text-to-Speech- und Text-to-Video-Konverter, mit dem du Audio- und Videoinhalte mit KI-Stimmen in weniger als einer Minute erstellen kannst. Mit Fliki kannst du deine Blog-Artikel oder textbasierten Inhalte mit wenigen Klicks in Videos, Podcasts oder Hörbücher mit Voiceovers konvertieren. Fliki bietet über 850 Stimmen in über 77 Sprachen und über 100 regionalen Dialekten. Eine funktionsreiche Text-to-Speech-Lösung, die eine herausragende Nutzererfahrung bietet. Auf was wartest du? Erfahre mehr über Fliki

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Synthesia CREATE ist eine Webplattform, die eine völlig neue Form der KI-gesteuerten Videoproduktion für Fachleute ermöglicht.
Synthesia CREATE ist eine Webplattform, die eine völlig neue Form der KI-gesteuerten Videoproduktion für Fachleute ermöglicht. Anstatt Inhalte mit einer Kamera zu filmen, wird Software zur Simulation echter Videos verwendet, sodass auf Filmteams, Studios und Kameras verzichtet werden kann. Dies ermöglicht eine schnelle und kostengünstige Erstellung von moderatorgeführten Videos. Anstatt Inhalte mit einer Kamera zu filmen, verwendet CREATE KI zur Simulation echter Videos, sodass auf Filmteams, Studios, Schauspieler und Kameras verzichtet werden kann. Erfahre mehr über Synthesia

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Descript ist eine All-in-one-Audio- und Videosoftware, die die Bearbeitung so einfach wie die Bearbeitung eines Word-Dokuments macht. Bearbeite Videos, indem du Text bearbeitest.
Descript ist ein All-in-one-Audio- und Video-Editor, der die Bearbeitung so einfach macht wie ein Word-Dokument. Lade Medien oder Aufzeichnungen direkt in Descript hoch, um deine Datei umgehend in Text zu transkribieren, und optimiere dann den Text, um deine Medienclips direkt zu bearbeiten. Schneide Füllwörter und stille Lücken mit einem einzigen Klick heraus. Zeichne deinen Bildschirm und deine Webcam für Präsentationen und Videonachrichten auf und schneide Fehler vor der Veröffentlichung heraus. Exportiere dein Projekt in andere professionelle Apps. Erfahre mehr über Descript

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Pictory ist eine KI-Lösung, die lange Inhalte wie Blogs, Webinare und Whitepaper in Dutzende von kurzen sozialen Videos umwandelt.
Pictory ist eine KI-Lösung, die lange Inhalte wie Blogs, Webinare und Whitepaper in Dutzende von kurzen sozialen Videos umwandelt. Erfahre mehr über Pictory

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
All-in-one-Webtool zum Erstellen von Videos, Filmen und Diashows in wenigen Minuten.
All-in-one-Webtool zum Erstellen von Videos, Filmen und Diashows in wenigen Minuten. Erfahre mehr über FlexClip

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Schreibtools einschließlich Übersetzung, Korrekturlesung, Neuformulierung von Sätzen, Wörterbuch und Umwandlung von Text in gesprochene Sprache.
Ginger Software ist ein preisgekröntes, produktivitätsorientiertes Unternehmen, das dir hilft, schneller und besser zu schreiben. Tools zur Grammatikprüfung, Interpunktion und Rechtschreibprüfung erkennen falsch geschriebene Wörter und Grammatikfehler automatisch und korrigieren diese. Erfahre mehr über Ginger

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Füge deinem Video über Text-to-Speech ein Voice-over mit einem Klick hinzu. Tippe Text ein, wähle ein Stimmprofil aus und höre deine Worte in Echtzeit.
VEED ist eine nutzerfreundliche, leistungsstarke Videobearbeitungsplattform. Die Lösung richtet sich an Content-Ersteller, Marketingteams, Coaches, HR- und Vertriebsteams und Podcaster und hilft dir dabei, deine guten Videos in beeindruckende zu verwandeln. KI-gestützte Tools wie Text-to-Speech sind ideal für Kamerascheue und für Teams, die keine Voice-over-Spezialisten haben oder Zeit erfassen. Tippe einfach deine Rede ein, wähle aus einer Reihe realistischer Stimmprofile aus und veröffentliche dein Video mit wenigen Klicks. Erfahre mehr über VEED

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Eine umfassende und leistungsstarke Cloud-API zum Konvertieren von Dateien. Hunderte von verschiedenen Formaten werden unterstützt - Dokumente, Bilder, Audio, Video und mehr.
Eine umfassende und leistungsstarke Cloud-API zum Konvertieren von Dateien mit Hunderten von unterstützten Formaten. Verwende die API zum einfachen Konvertieren von Dokumenten, Bildern, Audio, Video, CAD, E-Mail und mehr - insgesamt über 1.100 verschiedene Conversions. Umfassende Dokumentation für den minutenschnellen Einstieg und ein Support-Team mit Softwareentwicklern zur Unterstützung. Erfahre mehr über Zamzar

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Die Speechify-API ist eine ausgezeichnete API, mit der Websites und Anwendungen allen Inhalten eine "Play-Taste" für Audio hinzufügen können.
Die Speechify-API ist eine ausgezeichnete API, mit der Websites und Anwendungen allen Inhalten eine "Play-Taste" für Audio hinzufügen können. Zu den Speechify-Partnern gehören Websites mit großen Zielgruppen wie Medium.com und StarTribune.com. Die API erhöht die Verweilzeit auf Websites, die Zugänglichkeit und SEO sowie das Nutzerengagement, um den Umsatz zu steigern. Die Speechify-API umfasst Text-to-Speech, Texthervorhebung, mehrere menschenähnliche Stimmen, eine Skala zur Anpassung der Geschwindigkeit und ein iOS-SDK. Erfahre mehr über Speechify Text to Speech

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
KI-fähige Technologiesuite, mit der Videodimensionen zu Fotos und Porträts hinzugefügt werden können.
KI-fähige Technologiesuite mit Live Portrait, Face Lit und Speaking Portrait, sodass Videodimensionen zu Fotos und Porträts hinzugefügt werden können. Erfahre mehr über D-ID

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
ElevenLabs ist eine KI-Sprachsynthesesoftware, die Text in 29 Sprachen in natürlich klingende Stimmen umwandelt.
ElevenLabs ist eine Text-zu-Sprache- und KI-Stimmengeneratorsoftware. ElevenLabs ermöglicht es Benutzern, kostenlos Premium-KI-Stimmen zu erstellen und Text-zu-Sprach-Voiceovers in 29 Sprachen mit über 100 Stimmen in Minuten mithilfe eines Charakter-KI-Stimmengenerators zu generieren. Mit der kostenlosen Text-zu-Sprach-KI können Benutzer Text in MP3 in 29 Sprachen mit über 100 Stimmen umwandeln. ElevenLabs nutzt fortschrittliche KI-Modelle, um menschliche Intonation und Betonung originalgetreu nachzubilden und die Stimme an den Kontext anzupassen. Erfahre mehr über ElevenLabs

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
SaaS-, SDK- und API-Lösungen, die Text in natürlich klingende Audiodateien für Websites, E-Books, Anwendungen und mehr konvertieren.
ReadSpeaker ist ein unabhängiger Digital-Voice-Partner für Marken, Institutionen und Organisationen mit mehr als 20 Jahren Erfahrung. Die KI-gesteuerten Text-to-Speech-Lösungen verbessern die digitale Zugänglichkeit und ermöglichen nutzerfreundliche, ansprechende Interaktionen mit Technologie. Mit bis zu 200 ausdrucksstarken, menschenähnlichen digitalen Stimmen in über 50 Sprachen können die Lösungen in jeder Anwendung oder jedem Gerät eingesetzt werden. ReadSpeaker bietet SaaS-, SDK- und API-Lösungen für Streaming und Audioproduktion für die Online- oder Offline-Nutzung. Erfahre mehr über ReadSpeaker

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Ein textbasierter Voice-over-Maker mit hyperrealistischen KI-Stimmen. Geeignet für Unternehmen, KMU sowie Freiberufler.
Du kannst dein Skript eingeben oder einfach deine zu Hause erstellte Sprachaufzeichnung hochladen und innerhalb weniger Minuten in eine KI-Sprache in Studioqualität konvertieren. MURF macht es auch einfach, das Timing des Audios mit Videos oder Präsentationen im Tool selbst abzugleichen. Mit MURF kannst du: – realistische Sprachaufzeichnungen per Text für Präsentationen und Videos erstellen; – selbst aufgezeichnete Audio- oder Videoaufnahmen in professionelle KI-Aufzeichnungen konvertieren; – dein Audio per Text bearbeiten. Erfahre mehr über Murf Studio

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Cloudbasierte Text-to-Speech-Lösung, die Unternehmen bei der Verwaltung von Voiceovers durch Textanalyse, Stimmmodulationen und mehr unterstützt.
Cloudbasierte Text-to-Speech-Lösung, die Unternehmen bei der Verwaltung von Voiceovers durch Textanalyse, Stimmmodulationen und mehr unterstützt. Sie können den Text einfach in natürlich klingende Sprache umwandeln und sofort als MP3-Datei herunterladen. Sie können dem Voiceover eine Hintergrundmusik aus der voreingestellten Liste hinzufügen. Des Weiteren können Sie die Lautstärke der Hintergrundmusik steuern. Erfahre mehr über Speechactors

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Text-to-Speech SMS versenden Sie direkt aus Ihrem eCall-Konto oder über eine Schnittstelle. Diese Funktion unterstützen wir weltweit – inklusive der Bestätigung des Empfangs.
Text-to-Speech SMS versenden Sie direkt aus Ihrem eCall-Konto oder über eine Schnittstelle (API). Diese Funktion unterstützen wir weltweit – inklusive der Bestätigung des Empfangs. Zudem können Sie eingehende SMS als Sprachnachricht via Telefonanruf weiterleiten. Das System erkennt die Sprache des geschriebenen Texts automatisch und gibt diesen in der entsprechenden Sprachversion aus: Deutsch, Englisch, Französisch oder Italienisch. Darüber hinaus steht Ihnen auf Wunsch das Feature „High Privacy Voice„ zur Verfügung, bei dem sämtliche Inhalte nach der Verarbeitung überschrieben werden. Erfahre mehr über eCall

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices
Constructor Avatar: Einfache Text-to-Speech-Videoerstellung mit KI. Nutzerdefinierte Avatare, über 140 Sprachen. Ideal für Bildung, Marketing und mehr.
Vorstellung von Constructor Avatar: Durch Text-to-Speech-Funktionalität vereinfachte Videoerstellung mit KI – keine Studio- oder Bearbeitungskenntnisse erforderlich. Reduziere mit einem Abonnement die Videoproduktionszeit um 90 %. Erstelle mühelos überzeugende Vorträge, Unternehmensschulungen oder Marketingvideos. Passe die Avatare mit Gesten für besseres Engagement an, übersetze sie in über 140 Sprachen und wähle aus über 20 einsatzbereiten Avataren mit 3 Millionen Avatarkombinationen aus. Keine Nachproduktion erforderlich. Ideal für Bildungsinhalte, Produktdemos, Marketingkampagnen und Schulungen Erfahre mehr über Avatar

Funktionen

  • Erkennung phonetischer Varianten
  • Audio Editor
  • Mehrsprachig
  • AI Voices
  • Multi-Voice
  • Custom Voices