Zum Inhalt

Potentials of Advanced Text Technologies. Auf maschinellem Lernen basierende Texterkennung (PATT)

Projektstatus

geschlossen

Projektbeginn

September 2023

Förderlaufzeit

24 Monate

Beteiligte Hochschulen

ZHAW, UZH

Praxispartner

ETH-Bibliothek, Schweizerisches Sozialarchiv (Zürich), Staatsarchiv des Kantons Zürich, UZH Archiv, Zentralbibliothek Zürich

Das Erkennen komplexer Layouts und Handschriften, u.a. durch ATR, ist weit fortgeschritten. Ihre Bearbeitung in Forschung und Erinnerungsinstitutionen steht heute vor einem Quantensprung. Das Projekt etablierte eine Expert:innengruppe und ein Lehrmodul zu neuen Arbeitsverfahren. 

Automatisierte Handschriftenerkennung (Automated Text Recognition, ATR) ist die Methode, mithilfe von Algorithmen oder künstlicher Intelligenz Handschriften oder auch alte Druckschriften in computerlesbare Text zu verwandeln. Damit können Forschende grosse Mengen an Handschriftenseiten auswerten und aufbereiten. Gleichzeitig unterstützt die Methode Laien und Nicht-Spezialist:innen beim Entziffern alter Schriften oder Dokumente. Für die automatisierte Handschriftenerkennung benötigen entsprechende Programme eine digitale Version der ursprünglichen Dokumente und ein Modell, das der zu transkribierenden Schrift möglichst ähnlich sein soll. Diese Modelle wiederum werden von Forschenden und Institutionen auf grossen Datenmengen für verschiedene Zwecke trainiert und individualisiert.

Das Projekt «Potentials of Advanced Text Technologies: Machine Learning-based Text Recognition (PATT)» hat innerhalb der zwei Projektjahre eine Expert:innenrunde aufgebaut und regelmässige Workshops durchgeführt. Diese ermöglichten es dem Projektteam und weiteren mit ATR arbeitenden Personen, aktuelle Forschungsergebnisse auszutauschen und Best Practices im Umgang mit ATR den sich rasch entwickelnden technischen Möglichkeiten anzupassen. Das zweite erfolgreich erreichte Ziel war die Entwicklung eines Lernmoduls zum Einsatz von ATR. Das Lernmodul ist für alle interessierten Personen auf der e-learning Plattform Ad fontes Open Access frei verfügbar. Es erleichtert weiten Kreisen aus Forscher:innen und interessierten Laien ATR entsprechend den aktuellen technischen Möglichkeiten einzusetzen.

Die Expert:innenrunde mit den Workshops wird im Turnus von den bisher beteiligten Institutionen weitergeführt. Die e-learning Plattform Ad fontes wird in den kommenden Jahren sukzessiv stärker auf den Einsatz von ATR ausgerichtet.

Projektabschluss: PATT – Potentials of Advanced Text Technologies

Innovative Gesuche stellen den Menschen ins Zentrum