Zum Inhalt

SAGE

Sprechererkennung für kantonale Strafverfolgungsbehörden

Kriminelle Aktivitäten werden zunehmend über Telekommunikationskanäle koordiniert. Telefonbetrug erzeugt umfangreiche Audiodaten, die manuelle Auswertung unmöglich machen. Das SAGE-Projekt reagiert auf diese wachsenden Anforderungen an die Staatsanwaltschaft des Kantons Zürich und das Forensische Institut Zürich (FOR)  bei der Schätzung der Sprecheranzahl und der Sprechersegmentierung (wer spricht wann).

SAGE entwickelt robuste Speaker Embeddings, d.h. ein computerbasiertes Stimmenmodell, die speziell für forensisch herausfordernde Bedingungen optimiert sind: Kinder- und Frauenstimmen, schlechte Audioqualität und komplexe Mehrpersonengespräche. Das System ermöglicht es Nutzerinnen und Nutzern, Feedback zu geben, um die Ergebnisse iterativ zu verbessern.

Team

Dr. Srikanth Madikeri, UZH Institut für Computerlinguistik 

Prof. Dr. Thilo Stadelmann, ZHAW School of Engineering 

Prof. Dr. Volker Dellwo, UZH Institut für Computerlinguistik   

Praxispartner

Forensisches Institut Zürich

Kanton Zürich, Staatsanwaltschaft II 

Laufzeit: 2026-2029