publication . Bachelor thesis . 2008

Data warehouse de soporte a datos de GSA

Arribas López, Iván;
Open Access Spanish; Castilian
  • Published: 01 Jul 2008
  • Publisher: Facultad de Informática (UPM)
Abstract
El presente documento describe los procesos de extracción, transformación y carga de logs de GSA en un data warehouse. GSA (Google Search Appliance) es una aplicacion de Google que utiliza su gestor de consultas para buscar información en la información indexada de un determinado sitio web. Esta aplicación consecuentemente guarda un log de consultas de usuario a ese sitio web en formato estándar CLF modificado. Analizar este log le permitiría conocer al promotor del sitio en cuestión la información solicitada por los usuarios en el sitio.
Subjects
free text keywords: Informática
Download from
Archivo Digital UPM
Bachelor thesis . 2008

1. Introduccio´n y Objetivos 5 1.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2. Estado de la Cuesti´on 7 2.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2. Descubrimiento de conocimiento: Proceso KDD . . . . . . . . . . . . . . . 8 2.3. Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4. Data warehouse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4.2. Definicio´n de Data warehouse . . . . . . . . . . . . . . . . . . . . . 15 2.4.3. Disen˜o y construcci´on de un data warehouse . . . . . . . . . . . . . 18 2.5. ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3. Planteamiento del problema 27 3.1. Especificaci´on de requisitos . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4. An´alisis de los requisitos 29 4.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2. Requisitos funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.3. Requisitos no funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5. An´alisis del sistema 31 5.1. Introducci´on al ana´lisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5.2. An´alisis de los procesos de ETL . . . . . . . . . . . . . . . . . . . . . . . . 32 5.2.1. Proceso 1.1: Proceso de ETL en base de datos operacional . . . . . 32 5.2.2. Proceso 1.2: Proceso de ETL en data warehouse . . . . . . . . . . . 35 8. Conclusiones y l´ıneas futuras 81 8.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 8.2. L´ıneas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Introducci´on Introducci´on • request data query: id query, as dt, as epq, as lq, as occt, as oq, as q, as sitesearch, getfields, site, sitesearch, spell, gsa id session. Adem´as, se le asigna el mismo record number que ten´ıa el registro en log data. • request data results: client, filter, ie, language, num, num gm, oe, partialfields, proxycustom, proxyreload, proxystylesheet, requiredfields, sort, start. Al igual que en la tabla anterior, se le asigna el mismo record number. • query: El subcampo query. Adem´as, se le asigna el campo id query, insertado previamente en request data query.

Powered by OpenAIRE Open Research Graph
Any information missing or wrong?Report an Issue