
Der Thesaurus Linguae Latinae (TLL) ist ein umfassendes einsprachiges Wörterbuch, das kontextualisierte Bedeutungen und Verwendungen lateinischer Wörter in antiken Quellen verzeichnet. Wir haben einen neuen Datensatz zum Wortbedeutungsdisambiguierung (Word Sense Disambiguation) erstellt, der auf Bedeutungsdarstellungen im TLL basiert, und haben damit das Latin-BERT-Modell finegetuned. Unsere BERT-Resultate auf TLL-Daten sind besser als mit einem Vergleichsmodell (biLSTM-Architektur mit static embeddings) erzeugte, und ergaben eine höhere und robustere Leistung. Wir diskutieren die Unterschiede der Prinzipien für die Organisation der Bedeutungenzwischen den beiden lexikalischen Ressourcen und berichten über unsere Datensatzkonstruktion und verbesserte Bewertungsmethode.
Paper, Sprache, Disambiguierung von Wortbedeutungen, Vortrag, Annotieren, Modellierung, Latin BERT, Umwandlung, Deep Learning, Forschungsergebnis, Lexikalische Ressourcen, DHd2024, WSD, Bereinigung, Sprachmodell
Paper, Sprache, Disambiguierung von Wortbedeutungen, Vortrag, Annotieren, Modellierung, Latin BERT, Umwandlung, Deep Learning, Forschungsergebnis, Lexikalische Ressourcen, DHd2024, WSD, Bereinigung, Sprachmodell
