Stimmen begleiten uns ständig, ob in Gesprächen, Podcasts oder Filmen. Aber was, wenn wir plötzlich nicht mehr sicher sind, ob am anderen Ende überhaupt noch ein Mensch spricht?
Künstliche Intelligenz kann heute Stimmen erzeugen, die täuschend echt klingen. Wie funktioniert das technisch und sprachlich?
Phonetik-Professor Volker Dellwo erklärt, woran wir Stimmen erkennen und warum Stimmen nicht wie unveränderliche Fingerabdrücke sind. Stimmen sind komplexe, wandelbare Signale voller Informationen über Identität, Emotionen und Absichten. Wir sprechen über forensische Phonetik, Lügendetektoren und die Frage, wie verlässlich Stimmen als Beweismittel sind.
Ein Gespräch über die Wissenschaft hinter der Stimme, Vertrauen in Sprache und darüber, wieviel Menschlichkeit in synthetischer Sprache stecken kann.
Volker Dellwo ist Professor am Institut für Computerlinguistik der Universität Zürich. Er erforscht, wie Menschen und Maschinen sprecherbezogene Informationen im Sprachsignal erkennen und nutzen.
Weiterführende Links
- NCCR Evolving Languages
- VoCS MSCA
- SRF Einstein (Sendung vom 8. Mai 2025)
Schampar Digital ist ein Podcast der Digitalisierungsinitiative der Zürcher Hochschulen. Mehr Informationen und Episodenübersicht
Moderation: Frank Richter und Jessica Reust
Unser Podcast ist auf allen Plattformen verfügbar, z.B.