
В настоящее время объем данных, генерируемых машинами и человеческими взаимодействиями, быстро растет, и технологии развиваются, пытаясь решить эту проблему. Хотя большие данные широко обсуждаются на теоретическом уровне, существует ряд трудностей при их обработке.Целью данной работы является разработка модуля, который позволит классифицировать поток данных и затем обрабатывать его, принимая во внимание определенные параметры, такие как: типы файлов в соответствии с расширением типа, дата, имя и размер файла, используя в доказательство определенные методы и алгоритмы.Очевидно, что этот модуль позволит легче и быстрее обрабатывать и устранять определенные трудности, связанные со структурой больших данных.
The amount of data generated by machines and human interactions is now growing rapidly, and technologies are evolving trying to solve this problem. Although big data is widely discussed on a theoretical level, there are a number of difficulties in its processing.The aim of this work is to develop a module that will classify a data flow and then process it, taking into account certain parameters, such as: file types according to type extension, date, file name and size, using certain methods and algorithms as proof.Obviously, this module will allow easier and faster processing as well eliminate certain difficulties associated with the structure of big data.
Международный научно-исследовательский журнал, Выпуск 9 (123) 2022
набор данных, Big data, big data structures, algorithm, алгоритмы обработки данных, большие данные, data set, алгоритм, структуры больших данных
набор данных, Big data, big data structures, algorithm, алгоритмы обработки данных, большие данные, data set, алгоритм, структуры больших данных
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
