Downloads provided by UsageCounts
Überblick Dieser Code in der Programmiersprache 'R'. lädt alle in der amtlichen Datenbank des Bundesgerichtshofs veröffentlichten Entscheidungen des Bundesgerichtshofs (BGH) herunter und kompiliert sie in einen reichhaltigen menschen- und maschinenlesbaren Korpus. Es ist die Basis für den Corpus der Entscheidungen des Bundesgerichtshofs (CE-BGH). Alle mit diesem Code erstellten Datensätze werden dauerhaft kostenlos und urheberrechtsfrei auf Zenodo, dem wissenschaftlichen Archiv des CERN, veröffentlicht. Jede Version ist mit ihrem eigenen, persistenten Digital Object Identifier (DOI) versehen. Die neueste Version des Datensatzes ist immer über den Link der Concept DOI erreichbar: https://doi.org/10.5281/zenodo.3942742 NEU in Version 2024-09-25 Vollständige Aktualisierung der Daten LIZENZÄNDERUNG: Source Code jetzt unter GNU General Public License Version 3 (GPLv3) oder später lizenziert NEU: Zitationsnetzwerk Aktenzeichen-zu-BGHZ und Aktenzeichen zu BGHSt NEU: Variable für BGHZ Extraktion von Zitaten für Aktenzeichen-zu-Aktenzeichen komplett überarbeitet R-Version auf 4.4.0 aktualisiert (wegen CVE-2024-27322) Variable "bghr" wird nun korrekt extrahiert Source-Archiv wird nun aus dem Git-Manifest gebildet Anpassung von Compose File an Debian 11 Docker Zeitzone auf Berlin eingestellt Vereinfachung der Repository-Struktur Python Toolchain entfernt Zusätzliches Lösch-Skript mit Docker-Integration Verbesserung von Warnmeldungen Erweiterung der Unit Tests Erweiterung der automatischen Korrektur der Aktenzeichen Extraktion von PDFs ignoriert fehlerhafte PDFs Fix für Segmentation Fault bei Zählung von Types bei leeren Dokumenten Fix für gitconfig-Problem Diagramme nicht mehr nummeriert, sondern nach Typ geordnet Funktionsweise Primäre Endprodukte des Skripts sind folgende ZIP-Archive: Der volle Datensatz im CSV-Format (mit zusätzlichen Metadaten) Die reinen Metadaten im CSV-Format (wie unter 1, nur ohne Entscheidungsinhalte) Alle Entscheidungen im TXT-Format Alle Entscheidungen im PDF-Format Nur Leitsatz-Entscheidungen im PDF-Format Nur benannte Entscheidungen im PDF-Format Platzhalter-Dokumente im PDF-Format Zitationsnetzwerk im GraphML-Format (Aktenzeichen, BGHZ und BGHSt) Alle Analyse-Ergebnisse (Tabellen als CSV, Grafiken als PDF und PNG) Alle Ergebnisse werden im Ordner `output` abgelegt. Zusätzlich werden für alle ZIP-Archive kryptographische Signaturen (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei hinterlegt. Systemanforderungen Docker Docker Compose 25 GB Speicherplatz auf Festplatte Multi-core CPU empfohlen (8 cores/16 threads für die Referenzdatensätze). In der Standard-Einstellung wird das Skript vollautomatisch die maximale Anzahl an Rechenkernen/Threads auf dem System zu nutzen. Die Anzahl der verwendeten Kerne kann in der Konfigurationsatei angepasst werden. Wenn die Anzahl Threads auf 1 gesetzt wird, ist die Parallelisierung deaktiviert. Anleitung Schritt 1: Ordner vorbereiten Kopieren Sie bitte den gesamten Source Code in einen leeren Ordner (!), beispielsweise mit: $ git clone https://github.com/seanfobbe/ce-bgh Verwenden Sie immer einen separaten und leeren (!) Ordner für die Kompilierung. Die Skripte löschen innerhalb von bestimmten Unterordnern (files/, temp/, analysis/ und output/) alle Dateien die den Datensatz verunreinigen könnten --- aber auch nur dort. Schritt 2: Docker Image erstellen Ein Docker Image stellt ein komplettes Betriebssystem mit der gesamten verwendeten Software automatisch zusammen. Nutzen Sie zur Erstellung des Images einfach: $ bash docker-build-image.sh Schritt 3: Datensatz kompilieren Falls Sie zuvor den Datensatz schon einmal kompiliert haben (ob erfolgreich oder erfolglos), können Sie mit folgendem Befehl alle Arbeitsdaten im Ordner löschen: $ Rscript delete_all_data.R Den vollständigen Datensatz kompilieren Sie mit folgendem Skript: $ bash docker-run-project.sh Ergebnis Der Datensatz und alle weiteren Ergebnisse sind nun im Ordner output/ abgelegt. Pipeline visualisieren Sie können die Pipeline visualisieren, aber nur nachdem sie die zentrale .Rmd-Datei mindestens einmal gerendert haben: > targets::tar_glimpse() # Nur Datenobjekte > targets::tar_visnetwork() # Alle Objekte Troubleshooting Hilfreiche Befehle, um Fehler zu lokalisieren und zu beheben. > tar_progress() # Zeigt Fortschritt und Fehler an > tar_meta() # Alle Metadaten > tar_meta(fields = "warnings", complete_only = TRUE) # Warnungen > tar_meta(fields = "error", complete_only = TRUE) # Fehlermeldungen > tar_meta(fields = "seconds") # Laufzeit der Targets Weitere Open Access Veröffentlichungen (Fobbe) Website — www.seanfobbe.de Open Data — https://zenodo.org/communities/sean-fobbe-data/ Source Code — https://zenodo.org/communities/sean-fobbe-code/ Volltexte regulärer Publikationen — https://zenodo.org/communities/sean-fobbe-publications/ Urheberrecht Der Source Code und alle von mir bereitgestellten Rohdaten stehen unter der GNU General Public License v3.0 oder später. Beachten Sie bitte die Pflicht zur Weitergabe unter der gleichen Lizenz. Kontakt Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf GitHub oder kontaktieren Sie mich über www.seanfobbe.de
Kaufrecht, Revision, Text Mining, Urteil, Decision, Dienstgericht des Bundes, Netzwerkanalyse, Erbrecht, Federal Republic of Germany, Federal Court of Justice, Gericht, Citation Network, Ordentliche Gerichtsbarkeit, Entscheidung, Court, Text-as-data, Judgment, Germany, Sachenrecht, Patentrecht, Deutschland, Gesellschaftsrecht, BGH, Richter, Bundesgericht, Beschluss, Open Legal Data, Zivilrecht, Zitationsnetzwerk, R, Familienrecht, Kartellrecht, Bundesrepublik Deutschland, Source Code, Urheberrecht, Graphentheorie, Bankrecht, Graph Theory, Werkvertragsrecht, Strafrecht, Insolvenzrecht, Bundesgerichtshof, Oberster Gerichtshof des Bundes, Vergaberecht, Network Analysis
Kaufrecht, Revision, Text Mining, Urteil, Decision, Dienstgericht des Bundes, Netzwerkanalyse, Erbrecht, Federal Republic of Germany, Federal Court of Justice, Gericht, Citation Network, Ordentliche Gerichtsbarkeit, Entscheidung, Court, Text-as-data, Judgment, Germany, Sachenrecht, Patentrecht, Deutschland, Gesellschaftsrecht, BGH, Richter, Bundesgericht, Beschluss, Open Legal Data, Zivilrecht, Zitationsnetzwerk, R, Familienrecht, Kartellrecht, Bundesrepublik Deutschland, Source Code, Urheberrecht, Graphentheorie, Bankrecht, Graph Theory, Werkvertragsrecht, Strafrecht, Insolvenzrecht, Bundesgerichtshof, Oberster Gerichtshof des Bundes, Vergaberecht, Network Analysis
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
| views | 239 | |
| downloads | 33 |

Views provided by UsageCounts
Downloads provided by UsageCounts