Sprechererkennung für kantonale Strafverfolgungsbehörden
Kriminelle Aktivitäten werden zunehmend über Telekommunikationskanäle koordiniert. Telefonbetrug erzeugt umfangreiche Audiodaten, die manuelle Auswertung unmöglich machen. Das SAGE-Projekt reagiert auf diese wachsenden Anforderungen an die Staatsanwaltschaft des Kantons Zürich und das Forensische Institut Zürich (FOR) bei der Schätzung der Sprecheranzahl und der Sprechersegmentierung (wer spricht wann).
SAGE entwickelt robuste Speaker Embeddings, d.h. ein computerbasiertes Stimmenmodell, die speziell für forensisch herausfordernde Bedingungen optimiert sind: Kinder- und Frauenstimmen, schlechte Audioqualität und komplexe Mehrpersonengespräche. Das System ermöglicht es Nutzerinnen und Nutzern, Feedback zu geben, um die Ergebnisse iterativ zu verbessern.
Team
Dr. Srikanth Madikeri, UZH Institut für Computerlinguistik
Prof. Dr. Thilo Stadelmann, ZHAW School of Engineering
Prof. Dr. Volker Dellwo, UZH Institut für Computerlinguistik
Praxispartner
Kanton Zürich, Staatsanwaltschaft II
Laufzeit: 2026-2029