Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ ZENODOarrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Other literature type . 2024
License: CC BY
Data sources: ZENODO
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Other literature type . 2024
License: CC BY
Data sources: ZENODO
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Other literature type . 2023
License: CC BY
Data sources: ZENODO
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
INRIA2
Doctoral thesis . 2024
Data sources: INRIA2
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
https://doi.org/10.70675/ca531...
Doctoral thesis . 2026 . Peer-reviewed
Data sources: Crossref
ZENODO
Presentation . 2024
License: CC BY
Data sources: Datacite
ZENODO
Presentation . 2024
License: CC BY
Data sources: Datacite
ZENODO
Presentation . 2024
License: CC BY
Data sources: Datacite
ZENODO
Presentation . 2024
License: CC BY
Data sources: Datacite
ZENODO
Presentation . 2023
License: CC BY
Data sources: Datacite
ZENODO
Presentation . 2023
License: CC BY
Data sources: Datacite
versions View all 10 versions
addClaim

User-oriented exploration of semi-structured datasets

Authors: Barret, Nelly;

User-oriented exploration of semi-structured datasets

Abstract

Exploration orientée utilisateur de données semi-structurées La création, l'utilisation et le partage sans précédent des données à travers le monde contribue à de nouvelles applications et opportunités économiques. Ces données sont souvent larges, hétérogènes en schéma et en modèle, et plus ou moins structurées. Pour mettre de l’ordre dans toutes ces données, le consortium du World Wide Web recommande de partager des graphes RDF, ce qui a été majoritairement adopté dans l'Open Data, mais beaucoup d’autres formats sont utilisés en pratique.C’est souvent le cas des journalistes qui récoltent des jeux de données de différents acteurs, qui ne se sont pas coordonnés. Par exemple, on trouve sur la plateforme Kaggle des fichiers CSV recensant les pourcentages obtenus pour les candidats aux élections présidentielles françaises ; les déclarations d’intérêt des parlementaires et sénateurs français sont partagées en XML sur le site du gouvernement ; les tweets des personnalités politiques françaises sont disponibles en JSON ; les graphes de propriétés (comme ceux de Neo4J) sont utilisés pour partager les données d’Offshore leaks, une base de données sur les compagnies offshores, dont certaines sont françaises. Dans ce cadre, les journalistes ont cruellement besoin d'outils pour gérer et consolider des sources provenant de différents acteurs, et générer des résultats concrets qu'ils peuvent partager avec leurs collègues ou dans les rédactions.Plus généralement, les utilisateurs et producteurs de données (novices ou non) qui doivent trouver, utiliser et/ou partager des jeux de données se trouvent face à un exercice difficile.C'est pourquoi nous proposons de nouvelles méthodes pour appréhender, utiliser et partager des jeux de données semi-structurées, i.e., documents XML, documents JSON, tableaux CSV, graphes RDF et de propriétés. La motivation principale de ce travail est d'aider les utilisateurs dans leur tâche d'exploration, e.g., comprendre la structure de leurs données, trouver des informations intéressantes dans la masse, pouvoir formuler des requêtes sans grande expertise informatique, recouper plusieurs jeux de données provenant de différents acteurs, etc. Nous proposons une approche unifiée des différents modèles de données, une vue globale que nous pensons nécessaire pour tirer le meilleur de toutes ces données, que ce soit pour des applications journalistiques, rendre la recherche scientifique plus reproductible, etc.

Country
France
Keywords

Intégration de données, Data exploration, Entity-Relationship modeling, path exploration, [INFO] Computer Science [cs], heterogeneous data, Exploration de données, Modèle Entité-Relation, data exploration, Data integration, Données semi structurées, data integration, Semistructured data, summary data

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
Green