Estudio del estado del arte de sistemas de almacenamiento distribuido para el almacenamiento de datos de red

Las redes de gran escala como Internet están en constante crecimiento, una expansión en parte propiciada por el auge de servicios con un alto uso de ancho de banda, como streaming de vídeo. Este desarrollo, junto a ataques contra la seguridad de la red más frecuentes y sofisticados, ha favorecido que el análisis del tráfico que fluye por las redes sea aún más importante para cualquier empresa o institución. Y es que, siendo éstas partícipes de una sociedad global cada vez más interconectada y con una tasa de penetración de la tecnología en los hogares más alta cada año, necesitan estar protegidas ante accesos no autorizados a su infraestructura de red y, por tanto, a sus datos. La monitorización también es vital para detectar infraestructura de red defectuosa o congestionada y así poder realizar un mantenimiento preventivo. Como consecuencia de esto, se abre un complejo escenario donde son necesarios sistemas capaces de, por un lado, guardar la información del tráfico que atraviesa la red de manera segura y por otro, proporcionar un acceso sencillo y rápido a todo este tráfico de datos. Esta problemática necesita de grandes cantidades de almacenaje, y por lo tanto de muchos discos muy potentes para almacenar estos resultados. Las soluciones orientadas al Big Data son los productos adecuados para esta función y, dentro de estas, hemos estudiado los sistemas de almacenamiento distribuidos. Estos sistemas se basan en el paradigma de repartir la carga de trabajo entre los nodos de una red de ordenadores, buscando mover la computación a donde estén los datos. Cuando se habla de este tipo de software, vienen a la mente Apache Hadoop y su sistema de archivos distribuido HDFS, pero hay un buen número alternativas. En este trabajo de fin de grado analizaremos este último y otros cuatro sistemas de ficheros distribuidos. Primero, hemos comprobado su rendimiento como sistemas de almacenamiento aislado, y después como proveedores de almacenaje a un sistema de procesamiento distribuido. Nuestro objetivo es encontrar las diferencias, tanto teóricas como prácticas, de las soluciones disponibles en el mercado para este complejo problema, y realizar así un análisis del estado del arte en el que hemos encontrado diferencias interesantes.

Country

Spain

Related Organizations

Autonomous University of Madrid
Spain

Keywords

Big Data, Informática, sistemas de archivos distribuidos, computación distribuida

Impact byBIP!

	selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).	0
	popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.	Average
	influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).	Average
	impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.	Average

Found an issue? Give us feedback

0

Average

Green