
handle: 10045/1434
En este artículo se presenta un modelo innovador para la Recuperación de Información monolingüe en inglés y español. El modelo usa técnicas de Procesamiento de Lenguaje Natural (un etiquetador de categorías gramaticales –POS tagger–, un analizador sintáctico parcial y un módulo para la resolución de la anáfora) para mejorar la precisión de los sistemas tradicionales de Recuperación de Información; para ello, se realiza una indexación de las “entidades” y las “relaciones” entre estas entidades en los documentos. Para la evaluación del modelo se ha utilizado los corpus CLEF en español e inglés. Para las preguntas en inglés, se ha obtenido una mejora de 35,11% en la precisión media. Para las preguntas en español, el aumento máximo es de 37,18%.
In this paper, a novel model for monolingual Information Retrieval in English and Spanish language is proposed. This model uses Natural Language Processing techniques (a POStagger, a Partial Parser, and an Anaphora Resolver) in order to improve the precision of traditional IR systems, by means of indexing the “entities” and the “relations” between these entities in the documents. This model is evaluated on the Spanish and English CLEF corpora. For the English queries, there is a maximum increase of 35.11% in the average precision. For the Spanish queries, the maximum increase is 37.18%.
Natural language processing, Information retrieval, Procesamiento del lenguaje natural, Recuperación de información
Natural language processing, Information retrieval, Procesamiento del lenguaje natural, Recuperación de información
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
