
handle: 10486/688123
Las redes de gran escala como Internet están en constante crecimiento, una expansión en parte propiciada por el auge de servicios con un alto uso de ancho de banda, como streaming de vídeo. Este desarrollo, junto a ataques contra la seguridad de la red más frecuentes y sofisticados, ha favorecido que el análisis del tráfico que fluye por las redes sea aún más importante para cualquier empresa o institución. Y es que, siendo éstas partícipes de una sociedad global cada vez más interconectada y con una tasa de penetración de la tecnología en los hogares más alta cada año, necesitan estar protegidas ante accesos no autorizados a su infraestructura de red y, por tanto, a sus datos. La monitorización también es vital para detectar infraestructura de red defectuosa o congestionada y así poder realizar un mantenimiento preventivo. Como consecuencia de esto, se abre un complejo escenario donde son necesarios sistemas capaces de, por un lado, guardar la información del tráfico que atraviesa la red de manera segura y por otro, proporcionar un acceso sencillo y rápido a todo este tráfico de datos. Esta problemática necesita de grandes cantidades de almacenaje, y por lo tanto de muchos discos muy potentes para almacenar estos resultados. Las soluciones orientadas al Big Data son los productos adecuados para esta función y, dentro de estas, hemos estudiado los sistemas de almacenamiento distribuidos. Estos sistemas se basan en el paradigma de repartir la carga de trabajo entre los nodos de una red de ordenadores, buscando mover la computación a donde estén los datos. Cuando se habla de este tipo de software, vienen a la mente Apache Hadoop y su sistema de archivos distribuido HDFS, pero hay un buen número alternativas. En este trabajo de fin de grado analizaremos este último y otros cuatro sistemas de ficheros distribuidos. Primero, hemos comprobado su rendimiento como sistemas de almacenamiento aislado, y después como proveedores de almacenaje a un sistema de procesamiento distribuido. Nuestro objetivo es encontrar las diferencias, tanto teóricas como prácticas, de las soluciones disponibles en el mercado para este complejo problema, y realizar así un análisis del estado del arte en el que hemos encontrado diferencias interesantes.
Big Data, Informática, sistemas de archivos distribuidos, computación distribuida
Big Data, Informática, sistemas de archivos distribuidos, computación distribuida
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
