Disambiguierung von Wortbedeutungen aus dem Thesaurus Linguae Latinae mittels Fine-tuning von Latin BERT

Lendvai, Piroska; Wick, Claudia

Found an issue? Give us feedback

ZENODOarrow_drop_down

ZENODO

Conference object . 2024

License: CC BY

Data sources: ZENODO

Disambiguierung von Wortbedeutungen aus dem Thesaurus Linguae Latinae mittels Fine-tuning von Latin BERT

descriptionPublicationkeyboard_double_arrow_right Conference object 21 Feb 2024Publisher:Zenodo

Authors: Lendvai, Piroska; Wick, Claudia;

doi: 10.5281/zenodo.10698220

Disambiguierung von Wortbedeutungen aus dem Thesaurus Linguae Latinae mittels Fine-tuning von Latin BERT

- Summary
- Subjects

Abstract

Der Thesaurus Linguae Latinae (TLL) ist ein umfassendes einsprachiges Wörterbuch, das kontextualisierte Bedeutungen und Verwendungen lateinischer Wörter in antiken Quellen verzeichnet. Wir haben einen neuen Datensatz zum Wortbedeutungsdisambiguierung (Word Sense Disambiguation) erstellt, der auf Bedeutungsdarstellungen im TLL basiert, und haben damit das Latin-BERT-Modell finegetuned. Unsere BERT-Resultate auf TLL-Daten sind besser als mit einem Vergleichsmodell (biLSTM-Architektur mit static embeddings) erzeugte, und ergaben eine höhere und robustere Leistung. Wir diskutieren die Unterschiede der Prinzipien für die Organisation der Bedeutungenzwischen den beiden lexikalischen Ressourcen und berichten über unsere Datensatzkonstruktion und verbesserte Bewertungsmethode.

Keywords

Paper, Sprache, Disambiguierung von Wortbedeutungen, Vortrag, Annotieren, Modellierung, Latin BERT, Umwandlung, Deep Learning, Forschungsergebnis, Lexikalische Ressourcen, DHd2024, WSD, Bereinigung, Sprachmodell

Found an issue? Give us feedback