
Begleitender Quellcode zur Bachelorarbeit "Structure-Aware vs. Flat Chunking für RAG-Systeme: Eine Evaluation am Beispiel von Schulungsunterlagen" (Julian Maras, IU Internationale Hochschule, 2026). Dieses Repository enthält die vollständige Python-Pipeline zum Vergleich von Flat (Sliding Window) und Structure-Aware (hierarchischem) Chunking für Retrieval-Augmented Generation (RAG), evaluiert auf deutschsprachigen GEFEG.FX-Schulungsunterlagen. Inhalt: Implementierung beider Chunking-Strategien (src/, scripts/) Retrieval-Evaluation mit Recall@k, Precision@k und MRR LLM-as-Judge-Evaluation der Antwortqualität (GPT-4o-mini) Statistische Auswertung mit gepaarten t-Tests und Cohen's d Vollständige Ergebnisdaten und Visualisierungen (results/) Annotiertes Testset mit 50 Fragen (data/testset/) Die Schulungsunterlagen der GEFEG mbH sind aus Vertraulichkeitsgründen nicht enthalten. Die Ergebnisse sind vollständig über die bereitgestellten CSV-Dateien und Visualisierungen nachvollziehbar.
