KI hilft Historikern, altgriechische Inschriften zu vervollständigen, die über Jahrtausende beschädigt wurden – Tech

KI hilft Historikern altgriechische Inschriften zu vervollstaendigen die ueber Jahrtausende

Als ob es nicht schon schwer genug wäre, ein Gelehrter des Altgriechischen zu sein, sind die Primärtexte, auf die sie sich verlassen, häufig irreparabel beschädigt, da sie Tausende von Jahren alt sind. Historiker haben möglicherweise ein mächtiges neues Werkzeug in der Hand Ithaka, ein von DeepMind erstelltes maschinelles Lernmodell, das überraschend genaue Vermutungen bei fehlenden Wörtern sowie Ort und Datum des Textes anstellt. Es ist eine ungewöhnliche Anwendung von KI, aber eine, die zeigt, wie nützlich sie außerhalb der Tech-Welt sein kann.

Das Problem unvollständiger alter Texte zieht sich durch viele Disziplinen, in denen Experten mit degradierten Materialien arbeiten. Das Originaldokument kann aus Stein, Ton oder Papyrus bestehen, in Akkadisch, Altgriechisch oder Linear A geschrieben sein und alles beschreiben, von der Rechnung eines Lebensmittelhändlers bis hin zur Reise eines Helden. Allen gemeinsam ist jedoch der über Jahrtausende angesammelte Schaden.

Lücken, in denen der Text abgenutzt oder abgerissen ist, werden oft als Lücken bezeichnet und können so kurz wie ein fehlender Buchstabe oder so lang wie ein Kapitel oder sogar eine ganze Geschichte sein. Sie auszufüllen kann trivial oder unmöglich sein, aber irgendwo muss man anfangen – und dabei soll Ithaca helfen.

Ithaka (benannt nach der Heimatinsel von Odysseus) wurde mit einer riesigen Bibliothek antiker griechischer Texte trainiert und kann nicht nur sagen, was ein fehlendes Wort oder eine Phrase wahrscheinlich ist, sondern auch, wie alt es ist und wo es geschrieben wurde. Es wird nicht allein einen ganzen epischen Zyklus ausfüllen – es soll ein Werkzeug für diejenigen sein, die mit diesen Texten arbeiten, keine Lösung.

Ein in der Zeitschrift Nature veröffentlichter Artikel demonstriert seine Wirksamkeit am Beispiel einiger Dekrete von Periclean Athens. Vermutlich um 445 v. Chr. geschrieben, schlug Ithaka auf der Grundlage seiner Textanalyse vor, dass sie tatsächlich aus dem Jahr 420 v. Chr. stammen – in Übereinstimmung mit neueren Beweisen. Es mag nicht nach viel klingen, aber stellen Sie sich vor, die Bill of Rights wurde tatsächlich 20 Jahre später geschrieben!

Bildnachweis: DeepMind

Was den Text selbst angeht, haben die Experten der Studie beim ersten Durchlauf etwa 25 Prozent richtig gemacht, nicht gerade herausragend, obwohl die Textrestaurierung natürlich keine Nachmittagslerche sein soll, sondern ein langfristiges Projekt. Gepaart mit Ithaca erreichten sie jedoch schnell eine Genauigkeit von 72 Prozent. Dies ist oft in anderen Situationen der Fall, in denen Menschen letztendlich genauer sind, aber ihren Prozess beschleunigen können, indem sie Sackgassen schnell beseitigen oder einen Ausgangspunkt vorschlagen. In medizinischen Daten kann es leicht sein, eine Anomalie zu übersehen, die die KI schnell erkennen könnte – aber letztendlich ist es menschliches Fachwissen, das die Details wahrnimmt und die richtige Antwort findet.

Sie können a testen abgespeckte Version von Ithaka hier, wenn Sie einen lückenhaften altgriechischen Text zur Hand haben, oder verwenden Sie eines der bereitgestellten Beispiele, um zu sehen, wie er die gewünschten Lücken füllt. Bei längeren Stücken oder wenn mehr als 10 Buchstaben fehlen, probieren Sie es aus dieses Colab-Notizbuch. Den Code gibt es unter diese GitHub-Seite.

Obwohl Altgriechisch ein offensichtlicher und fruchtbarer Bereich ist, in dem Ithaka anfangen kann, arbeitet das Team bereits hart an anderen Sprachen. Akkadisch, Demotisch, Hebräisch und Maya stehen alle auf der Liste, und hoffentlich werden im Laufe der Zeit weitere hinzugefügt.

„Ithaca veranschaulicht den potenziellen Beitrag der Verarbeitung natürlicher Sprache und des maschinellen Lernens in den Geisteswissenschaften“, sagte Ion Androutsopoulos, Professor an der Universität Athen, der an dem Projekt arbeitete. „Wir brauchen mehr Projekte wie Ithaca, um dieses Potenzial weiter zu zeigen, aber auch geeignete Kurse und Lehrmaterialien, um zukünftige Forscher auszubilden, die ein besseres gemeinsames Verständnis sowohl der Geisteswissenschaften als auch der KI-Methoden haben.“

tch-1-tech