Zum Inhalt

Aktueller Stand der maschinellen Sprachverarbeitung für Latein und Altgriechisch

Was ist momentan grundsätzlich möglich?

Die aktuellen Möglichkeiten der maschinellen Sprachverarbeitung für Latein und Altgriechisch erlauben es uns beispielsweise,

  • Informationslücken in historiografischen Texten zu finden, indem wir Personen, Orte und andere Eigennamen erkennen.
  • die Rolle der Polis in Epitaphien zu untersuchen, indem wir
    • Wörter und Textstellen thematisch durchsuchen und gruppieren und
    • moralisch positive und negative Narrative identifizieren.
  • die Imitation des Ciceronischen Stils in neuzeitlichen Aufsätzen nachzuweisen, indem wir
    • den Satzbau analysieren, z.B. Subjekte, Objekte, Prädikate,
    • Wortarten erkennen,
    • morphologische Informationen erkennen, z.B. Kasus, Numerus, Genus, Tempus, Modus.

Fehleranfälligkeit

Die maschinelle Sprachverarbeitung befindet sich in stetiger Weiterentwicklung. Systeme zur automatischen Analyse antiker Sprachen sind nie perfekt, machen also Fehler. Ein Beispiel ist die Lemmatisierung, wo flektierten Wörtern mitunter die falsche Grundform zugeordnet wird.

Geschwindigkeit der Weiterentwicklung

Dennoch wird die Leistung der Algorithmen tendenziell immer besser, d.h. sie machen ihre Arbeit schneller und zuverlässiger. Darum lohnt es sich, den Stand der Dinge im Blick zu behalten und regelmäßig neu zu evaluieren. Selbst wenn die Ergebnisse in einem bestimmten Fall noch nicht unseren Ansprüchen genügen, kann dies schon wenige Jahre später ganz anders aussehen.

Notwendigkeit der Fortbildung

Solange wir also mit solchen Algorithmen arbeiten, sollten wir uns regelmäßig fortbilden:

  • Welche neuen Veröffentlichungen zum Thema gibt es?
  • Wie funktionieren die neuen Algorithmen und Methoden?
  • Was wird wahrscheinlich demnächst möglich sein?

Zum Nachlesen

Berti, Monica. Digital Classical Philology: Ancient Greek and Latin in the Digital Revolution. Vol. 10. Age of Access? Grundfragen Der Informationsgesellschaft. Berlin: Walter de Gruyter & Co, 2019.

Johnson, Kyle P, Patrick J Burns, John Stewart, Todd Cook, Clément Besnier, and William JB Mattingly. “The Classical Language Toolkit: An NLP Framework for Pre-Modern Languages,” 20–29, 2021. PDF

Revellio, Marie. “Classics and the Digital Age: Advantages and Limitations of Digital Text Analysis in Classical Philology.” LitLingLab Pamphlet 2 (2015). PDF

Short, William. “Blog: Computational Classics? Programming Natural Language Understanding.” Society for Classical Studies Blog (blog), 2019. PDF

Sommerschield, Thea, Yannis Assael, John Pavlopoulos, Vanessa Stefanak, Andrew Senior, Chris Dyer, John Bodel, Jonathan Prag, Ion Androutsopoulos, and Nando de Freitas. “Machine Learning for Ancient Languages: A Survey.” Computational Linguistics, 2023, 1–45.