Aktueller Stand der maschinellen Sprachverarbeitung für Latein und Altgriechisch
Was ist momentan grundsätzlich möglich?
Die aktuellen Möglichkeiten der maschinellen Sprachverarbeitung für Latein und Altgriechisch erlauben es uns beispielsweise,
- Informationslücken in historiografischen Texten zu finden, indem wir Personen, Orte und andere Eigennamen erkennen.
- die Rolle der Polis in Epitaphien zu untersuchen, indem wir
- Wörter und Textstellen thematisch durchsuchen und gruppieren und
- moralisch positive und negative Narrative identifizieren.
- die Imitation des Ciceronischen Stils in neuzeitlichen Aufsätzen nachzuweisen, indem wir
- den Satzbau analysieren, z.B. Subjekte, Objekte, Prädikate,
- Wortarten erkennen,
- morphologische Informationen erkennen, z.B. Kasus, Numerus, Genus, Tempus, Modus.
Fehleranfälligkeit
Die maschinelle Sprachverarbeitung befindet sich in stetiger Weiterentwicklung. Systeme zur automatischen Analyse antiker Sprachen sind nie perfekt, machen also Fehler. Ein Beispiel ist die Lemmatisierung, wo flektierten Wörtern mitunter die falsche Grundform zugeordnet wird.
Geschwindigkeit der Weiterentwicklung
Dennoch wird die Leistung der Algorithmen tendenziell immer besser, d.h. sie machen ihre Arbeit schneller und zuverlässiger. Darum lohnt es sich, den Stand der Dinge im Blick zu behalten und regelmäßig neu zu evaluieren. Selbst wenn die Ergebnisse in einem bestimmten Fall noch nicht unseren Ansprüchen genügen, kann dies schon wenige Jahre später ganz anders aussehen.
Notwendigkeit der Fortbildung
Solange wir also mit solchen Algorithmen arbeiten, sollten wir uns regelmäßig fortbilden:
- Welche neuen Veröffentlichungen zum Thema gibt es?
- Wie funktionieren die neuen Algorithmen und Methoden?
- Was wird wahrscheinlich demnächst möglich sein?
Zum Nachlesen
Berti, Monica. Digital Classical Philology: Ancient Greek and Latin in the Digital Revolution. Vol. 10. Age of Access? Grundfragen Der Informationsgesellschaft. Berlin: Walter de Gruyter & Co, 2019.
Johnson, Kyle P, Patrick J Burns, John Stewart, Todd Cook, Clément Besnier, and William JB Mattingly. “The Classical Language Toolkit: An NLP Framework for Pre-Modern Languages,” 20–29, 2021. PDF
Revellio, Marie. “Classics and the Digital Age: Advantages and Limitations of Digital Text Analysis in Classical Philology.” LitLingLab Pamphlet 2 (2015). PDF
Short, William. “Blog: Computational Classics? Programming Natural Language Understanding.” Society for Classical Studies Blog (blog), 2019. PDF
Sommerschield, Thea, Yannis Assael, John Pavlopoulos, Vanessa Stefanak, Andrew Senior, Chris Dyer, John Bodel, Jonathan Prag, Ion Androutsopoulos, and Nando de Freitas. “Machine Learning for Ancient Languages: A Survey.” Computational Linguistics, 2023, 1–45.