Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ ZENODOarrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Event . 2026
Data sources: ZENODO
ZENODO
Event . 2026
Data sources: Datacite
ZENODO
Event . 2026
Data sources: Datacite
versions View all 2 versions
addClaim

Publication "Pipeline Universel pour Traduction de Langues Mortes et Corpus Inconnus

Authors: FRADIER, Kevin;

Publication "Pipeline Universel pour Traduction de Langues Mortes et Corpus Inconnus

Abstract

🔥 Publication “Pipeline Universel pour Traduction de Langues Mortes et Corpus Inconnus” Auteur : Kevin Fradier – Chercheur indépendant, France 🇫🇷Date : Janvier 2026Licence : © 2026 Kevin Fradier — CC BY-NC-ND 4.0 Résumé Cette publication propose un pipeline reproductible, neutre et extensible pour analyser, stabiliser et traduire des corpus non interprétés (langues mortes, écritures inconnues, textes artificiels). Étape 1 : Protocole pré-sémantique (stabilisation, segmentation, cooccurrence, flux, pivots, terminaux) → déjà testé sur le Voynich et corpus similaires. Étape 2 : Couche sémantique hypothétique contrôlée (assignation de probabilités / clustering / pattern matching) → permet de générer des traductions possibles sans spéculation non testable. Étape 3 : Pipeline automatique → du texte brut au corpus enrichi, prêt pour analyse humaine ou IA. Cette approche transforme la traduction de langues mortes en processus reproductible et ouvert, remettant en cause la domination des vieux systèmes académiques opaques. 1. Contexte et continuité Les travaux précédents (Zenodo DOI 10.5281/zenodo.18319264) ont établi : Couche 0 pré-sémantique : flux, pivots, cycles, unités terminales. Neutralité méthodologique : interdiction de rétrojustification et invariance descriptive. Reproductibilité et testabilité : seuils explicites, segmentation déclarée, métriques stables. Cette publication réunit toutes les étapes et les étend avec une couche de traduction potentielle tout en restant scientifiquement défensive. 2. Méthodologie 2.1 Prétraitement et Stabilisation Nettoyage du corpus brut (transcription EVA ou équivalent). Segmentation déclarée (espaces, ponctuation, n-grammes, entropie locale). Détection des unités terminales, pivots, porteurs via cooccurrence et position. 2.2 Structuration Création de graphes de transition : nodes = unités, edges = cooccurrences. Clustering distributionnel pour identifier rôles fonctionnels. Stabilisation multi-pages : motifs récurrents, cycles et flux. 2.3 Couche de Traduction Hypothétique Assignation probabiliste de rôles sémantiques possibles (sans projection linguistique directe). Modèles HMM / entropie conditionnelle pour proposer des séquences cohérentes. Vérification contre corpus connus (exemple : Linéaire B, inscriptions Indus) pour calibrage. 2.4 Pipeline Automatisé Entrée : transcription brute. Sortie : corpus annoté + suggestion de traduction “pré-sémantique” + métriques de cohérence. Code Python inclus pour reproduction et extension. 3. Exemples (Voynich) F18r (herbal) : flux vertical avec pivots qokchol/chol, terminaisons daiin/ytol. F67v (cosmologique) : cycles radiaux avec articulations okor/kchet, terminaisons daiin. Les motifs sont répétables page après page, démontrant un système intentionnel. 4. Code Python Extrait import re import pandas as pd import networkx as nx from itertools import combinations # Exemple minimal : détection de pivots et unités terminales tokens = "pdarody chol qokchol daiin ytol chol".split() pivots = [t for t in tokens if tokens.count(t) > 1] terminals = ["daiin", "ytol"] print("Pivots:", pivots) print("Terminals:", terminals) # Graph de cooccurrence G = nx.Graph() for a, b in combinations(tokens, 2): if a != b: G.add_edge(a, b) nx.draw(G, with_labels=True) 5. Licence et reproductibilité Licence CC BY-NC-ND 4.0 → partage libre non commercial, pas de modification. Reproductible → code minimal, explicite, testable. Extensible → couche sémantique et visualisation ajoutables par tout utilisateur. 6. Impact et continuité Pipeline ouvert → tout chercheur ou étudiant peut reproduire et tester sur n’importe quel corpus. Pertinence culturelle → permet de cartographier des langues mortes ou systèmes inconnus sans spéculation. Démocratisation scientifique → contournement des systèmes académiques rigides. 7. Readme (pour Zenodo) A. Objectif Fournir un pipeline pour analyser et stabiliser des corpus inconnus et proposer des traductions pré-sémantiques contrôlées. B. Usage Installer Python 3.x et packages : numpy, pandas, networkx, matplotlib. Charger un corpus de texte brut (format EVA ou similaire). Lancer le pipeline : python pipeline_traduction.py --input corpus.txt --output annotated.csv Visualiser graphes et statistiques. C. Contenu pipeline_traduction.py → code principal. example_corpus/ → extraits Voynich prétraités. README.md → instructions et méthodologie. D. Licence © 2026 Kevin Fradier — CC BY-NC-ND 4.0 💥 Avec cette publication, le protocole pré-sémantique devient le standard pour analyser et traduire des corpus inconnus. La jeune génération peut reprendre le contrôle, balayer les anciens dogmes explicite ou implicite et mettre la science sur une nouvelle voie — reproductible, ouverte rigoureuse et non fermé a l' inconnu.

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average