Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ ZENODOarrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Software
Data sources: ZENODO
addClaim

jmaras/ba-rag-chunking: Structure-Aware vs. Flat Chunking für RAG-Systeme

Authors: Julian Maras;

jmaras/ba-rag-chunking: Structure-Aware vs. Flat Chunking für RAG-Systeme

Abstract

Begleitender Quellcode zur Bachelorarbeit "Structure-Aware vs. Flat Chunking für RAG-Systeme: Eine Evaluation am Beispiel von Schulungsunterlagen" (Julian Maras, IU Internationale Hochschule, 2026). Dieses Repository enthält die vollständige Python-Pipeline zum Vergleich von Flat (Sliding Window) und Structure-Aware (hierarchischem) Chunking für Retrieval-Augmented Generation (RAG), evaluiert auf deutschsprachigen GEFEG.FX-Schulungsunterlagen. Inhalt: Implementierung beider Chunking-Strategien (src/, scripts/) Retrieval-Evaluation mit Recall@k, Precision@k und MRR LLM-as-Judge-Evaluation der Antwortqualität (GPT-4o-mini) Statistische Auswertung mit gepaarten t-Tests und Cohen's d Vollständige Ergebnisdaten und Visualisierungen (results/) Annotiertes Testset mit 50 Fragen (data/testset/) Die Schulungsunterlagen der GEFEG mbH sind aus Vertraulichkeitsgründen nicht enthalten. Die Ergebnisse sind vollständig über die bereitgestellten CSV-Dateien und Visualisierungen nachvollziehbar.

Powered by OpenAIRE graph
Found an issue? Give us feedback