Projektstatus
geschlossen
Projektbeginn
September 2023
Förderlaufzeit
24 Monate
Beteiligte Hochschulen
ZHAW, UZH
Praxispartner
ETH-Bibliothek, Schweizerisches Sozialarchiv (Zürich), Staatsarchiv des Kantons Zürich, UZH Archiv, Zentralbibliothek Zürich
Das Erkennen komplexer Layouts und Handschriften, u.a. durch ATR, ist weit fortgeschritten. Ihre Bearbeitung in Forschung und Erinnerungsinstitutionen steht heute vor einem Quantensprung. Das Projekt etablierte eine Expert:innengruppe und ein Lehrmodul zu neuen Arbeitsverfahren.
Automatisierte Handschriftenerkennung (Automated Text Recognition, ATR) ist die Methode, mithilfe von Algorithmen oder künstlicher Intelligenz Handschriften oder auch alte Druckschriften in computerlesbare Text zu verwandeln. Damit können Forschende grosse Mengen an Handschriftenseiten auswerten und aufbereiten. Gleichzeitig unterstützt die Methode Laien und Nicht-Spezialist:innen beim Entziffern alter Schriften oder Dokumente. Für die automatisierte Handschriftenerkennung benötigen entsprechende Programme eine digitale Version der ursprünglichen Dokumente und ein Modell, das der zu transkribierenden Schrift möglichst ähnlich sein soll. Diese Modelle wiederum werden von Forschenden und Institutionen auf grossen Datenmengen für verschiedene Zwecke trainiert und individualisiert.
Das Projekt «Potentials of Advanced Text Technologies: Machine Learning-based Text Recognition (PATT)» hat innerhalb der zwei Projektjahre eine Expert:innenrunde aufgebaut und regelmässige Workshops durchgeführt. Diese ermöglichten es dem Projektteam und weiteren mit ATR arbeitenden Personen, aktuelle Forschungsergebnisse auszutauschen und Best Practices im Umgang mit ATR den sich rasch entwickelnden technischen Möglichkeiten anzupassen. Das zweite erfolgreich erreichte Ziel war die Entwicklung eines Lernmoduls zum Einsatz von ATR. Das Lernmodul ist für alle interessierten Personen auf der e-learning Plattform Ad fontes Open Access frei verfügbar. Es erleichtert weiten Kreisen aus Forscher:innen und interessierten Laien ATR entsprechend den aktuellen technischen Möglichkeiten einzusetzen.
Die Expert:innenrunde mit den Workshops wird im Turnus von den bisher beteiligten Institutionen weitergeführt. Die e-learning Plattform Ad fontes wird in den kommenden Jahren sukzessiv stärker auf den Einsatz von ATR ausgerichtet.
Projektverantwortliche
Prof. Dr. Cerstin Mahlow, ZHAW, Angewandte Linguistik
Prof. Dr. Simon Teuscher, UZH, Historisches Seminar
Projektkoordination
Laura Bitterli, UZH, Historisches Seminar
Projektpartner:innen (Forschung)
Prof. Dr. Noah Bubenhofer, UZH, Deutsches Seminar
Prof. Dr. Tobias Hodel, UniBe, Digital Humanities
PD Dr. Gerold Schneider, UZH, Leiter NLP Gruppe in LiRI Tech
Prof. Dr. Martin Volk, UZH, Institut für Computerlinguistik
Digital History Lab (DHL), Historisches Seminar, UZH, (Koordination: Christine Grundig MA)
Praxispartner:innen (Gedächtnisinstitutionen)
ETH-Bibliothek, Sektion Sammlungen und Archive
Schweizerisches Sozialarchiv (Zürich)
Staatsarchiv des Kantons Zürich, Abteilung Nacherschliessung und Digitalisierung
Laufzeit: 2023-2025