publication . Master thesis . 2017

Data storage and processing in Hive-based Big Data Warehouses

Costa, Eduarda Alexandra Pinto da;
Open Access Portuguese
  • Published: 01 Jan 2017
  • Country: Brazil
Abstract
Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação A quantidade de dados que é produzida nos dias de hoje tem aumentado exponencialmente, como consequência da disponibilidade de novas fontes de dados e, também, devido aos avanços que vão surgindo na área de recolha e armazenamento de dados. Esta explosão de dados foi acompanhada pela popularização do conceito de Big Data, que pode ser definido como grandes volumes de dados, com diferentes graus de complexidade, muitas vezes sem estrutura e organização, que não podem ser processados ou analisados com processos ou ferramentas tradicionais. Os Data Warehouses surgem como uma peça cen...
Subjects
free text keywords: Big Data Warehouse, Hive, Partições, Buckets, Desempenho, Partitions, Performance, :Outras Engenharias e Tecnologias [Engenharia e Tecnologia]
Related Organizations

Alekseev, A. A., Osipova, V. V., Ivanov, M. A., Klimentov, A., Grigorieva, N. V., & Nalamwar, H. S. (2016). Efficient Data Management Tools for the Heterogeneous Big Data Warehouse. Physics of Particles and Nuclei Letters, 13(5), 689-692. https://doi.org/10.1134/S1547477116050022

Apache. (2014). Apache Hadoop. Retrieved from http://hadoop.apache.org/

Bhardwaj, A., Vanraj, Kumar, A., Narayan, Y., & Kumar, P. (2015). Big Data Emerging Technologies: A CaseStudy with Analyzing Twitter Data using Apache Hive. In Recent Advances in Engineering & Computational Sciences (RAECS), 2nd International Conference on. IEEE. https://doi.org/10.1109/RAECS.2015.7453400

Bhogal, J., & Choksi, I. (2015). Handling Big Data Using NoSQL. In Advanced Information Networking and Applications Workshops (WAINA), 29th International Conference on (pp. 393-398). IEEE. https://doi.org/10.1109/WAINA.2015.19 [OpenAIRE]

Capriolo, E., Wampler, D., & Rutherglen, J. (2012). Programming Hive. O'Reilly Media, Inc.

Cassavia, N., Dicosta, P., Masciari, E., & Saccà, D. (2014). Data Preparation for Tourist Data Big Data Warehousing. In Proceedings of 3rd International Conference on Data Management Technologies and Applications (DATA) (pp. 419-426). SciTePress. https://doi.org/10.5220/0005144004190426 [OpenAIRE]

Chavalier, M., El Malki, M., Kopliku, A., Teste, O., & Tournier, R. (2016). Document-Oriented Data Warehouses: Models and Extended Cuboids. In 10th International Conference on Research Challenges in Information Science (RCIS) (pp. 1-11). IEEE. https://doi.org/10.1109/RCIS.2016.7549351

Chen, J., Chen, Y., Du, X., Li, C., Lu, J., Zhao, S., & Zhou, X. (2013). Big data challenge: A data management perspective. Frontiers of Computer Science, 7(2), 157-164. https://doi.org/10.1007/s11704-013-3903-7

Chen, M., Mao, S., & Liu, Y. (2014). Big Data : A Survey. Mobile Networks and Applications, 19(2), 171- 209. https://doi.org/10.1007/s11036-013-0489-0

Chevalier, M., El Malki, M., Kopliku, A., Teste, O., & Tournier, R. (2016). Document-oriented Models for Data Warehouses - NoSQL Document-oriented for Data Warehouses. In Proceedings of the 18th International Conference on Enterprise Information Systems (Vol. 1, pp. 142-149). SCITEPRESS - Science and and Technology Publications. https://doi.org/10.5220/0005830801420149

Costa, E., Costa, C., & Santos, M. Y. (2017). Efficient Big Data Modelling and Organization for Hadoop

Powered by OpenAIRE Open Research Graph
Any information missing or wrong?Report an Issue