
handle: 10578/18585
Este proyecto fin de grado pretende generar un programa informático totalmente libre para que la comunidad de usuarios pueda aportar nuevas ideas, mejoras o se pueda utilizar de modo personalizado. A partir del lenguaje de programación Python se pretende explorar un dominio web, descubrir todos sus ficheros, extraer sus metadatos e incluirlos en una base de datos para poder un posterior análisis de estos. Para poder llegar a realizar este propósito, se ha creado una araña web con la librería Scrapy que explore todo el dominio, encuentre los enlaces de los ficheros que se hallen en las distintas URL que se recorran con ésta para posteriormente descargarlos y extraer los metadatos de ellos con distintas librerías de software libre. Por último, estos metadatos se incluyen dentro de una base de datos SQLite para poder gestionar estos datos de una forma mucho más sencilla. Además, se incluye la posibilidad de exportar los datos extraídos de los documentos o imágenes encontrados a ficheros JSON y XML. Para ello, se hace una lectura de la base de datos para poder escribir estos ficheros.
Tecnología de la información
Tecnología de la información
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
