
Das Poster zeigt am Beispiel vom Diccionario del Español Medieval electrónico (DEMel), wie lexikografische Daten mit ihren Quellentexten verknüpft werden können. Das Projekt stellt ein lemmatisiertes Datenarchiv zum mittelalterlichen Spanisch zur Verfügung, das durch die Digitalisierung und Erschließung einer in Zettelkästen archivierten Belegsammlung entstanden ist. Bisher wurden nur wenige Informationen von den Zetteln per Hand in einer relationalen Datenbank erfasst. Nun sollen die Belege mit Hilfe von OCR und HTR (semi)automatisch in den TEI kodierten Quellentexten ausgezeichnet werden. Das Poster stellt den Prozess schematisch dar und diskutiert die Vor- und Nachteile der gewählten Methode.
Paper, Automatische Texterkennung, Lexikografie, Datenerkennung, Annotieren, DHd2024, Datenbank, Mittelalterliches Spanisch, Programmierung, TEI, Posterpräsentation
Paper, Automatische Texterkennung, Lexikografie, Datenerkennung, Annotieren, DHd2024, Datenbank, Mittelalterliches Spanisch, Programmierung, TEI, Posterpräsentation
