
Gerenciadores de documentos (GDs) ou document stores, como MongoDB e CouchDB, têm se tornado cada vez mais populares devido à flexibilidade em carregar e recuperar dados em larga escala usando documentos semi-estruturados, pois evitam a necessidade de definição de esquemas antes da ingestão de dados. Por outro lado, especificar consultas neste tipo de sistema é uma tarefa complexa, ainda mais que em sistemas relacionais, devido à natureza semi-estruturada dos documentos e à possibilidade de aninhar itens de dados complexos. Para lidar com esse problema, apresentamos uma abordagem chamada SEREIA, que permite a execução de consultas por palavras-chave sobre coleções de documentos armazenados em GDs sem necessidade de conhecimento da estrutura das coleções. Nossa abordagem é baseada na geração de Candidate Join Networks que representam diferentes interpretações da consulta fornecida, a fim de ranqueá-las e escolher a alternativa mais adequada. Experimentos realizados em um banco de dados representativo, contendo diversas coleções de documentos, mostram que nossa abordagem foi eficaz em gerar consultas estruturadas que satisfazem a intenção original do usuário expressa na consulta por palavras-chave, alcançando valores de Precisão e MRR de 1.0 e 0.98, respectivamente.
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 2 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
