
Les valeurs manquantes apparaissent dans la plupart des séries chronologiques multivariées, en particulier dans les données de trafic réseau surveillées en raison du coût de mesure élevé et des pertes inévitables. Dans les domaines de la mise en réseau, les données manquantes empêchent l'analyse avancée et dégradent les applications en aval telles que l'ingénierie du trafic et la détection des anomalies. Malgré le grand potentiel, les approches d'imputation existantes basées sur la décomposition tensorielle et les techniques d'apprentissage profond ont montré des limites dans la résolution des valeurs manquantes des données de trafic en raison de son comportement dynamique. Dans cet article, nous proposons Graph Convolutional Recurrent Neural Network for Imputing Network Traffic (GCRINT), une combinaison entre Recurrent Neural Network (RNN) et Graph Convolutional Neural Network, pour remplir les valeurs manquantes des données de trafic réseau. Nous utilisons un réseau bidirectionnel de mémoire à long terme et un réseau neuronal graphique pour apprendre efficacement les corrélations spatio-temporelles dans les données partiellement observées. Nous avons mené des expériences approfondies pour évaluer notre modèle en utilisant deux ensembles de données différents et divers scénarios manquants. Les résultats de l'expérience montrent que GCRINT réalise des erreurs d'imputation significativement faibles et réduit l'erreur de 35% par rapport aux méthodes de pointe. GCRINT aide également à obtenir une performance stable dans le problème d'ingénierie du trafic.
Los valores faltantes aparecen en la mayoría de las series temporales multivariadas, especialmente en los datos de tráfico de red monitoreados debido al alto costo de medición y la pérdida inevitable. En los campos de redes, los datos faltantes impiden el análisis avanzado y degradan las aplicaciones posteriores, como la ingeniería de tráfico y la detección de anomalías. A pesar del gran potencial, los enfoques de imputación existentes basados en la descomposición de tensores y las técnicas de aprendizaje profundo han mostrado limitaciones para abordar los valores faltantes de los datos de tráfico debido a su comportamiento dinámico. En este documento, proponemos Graph Convolutional Recurrent Neural Network for Imputing Network Traffic (GCRINT), una combinación entre Recurrent Neural Network (RNN) y Graph Convolutional Neural Network, para llenar los valores faltantes de los datos de tráfico de red. Utilizamos una red bidireccional de memoria a largo plazo y una red neuronal gráfica para aprender de manera eficiente las correlaciones espacio-temporales en datos parcialmente observados. Realizamos extensos experimentos para evaluar nuestro modelo utilizando dos conjuntos de datos diferentes y varios escenarios faltantes. Los resultados del experimento muestran que GCRINT logra errores de imputación significativamente bajos y reduce el error en un 35% en comparación con los métodos del estado de la técnica. GCRINT también ayuda a obtener un rendimiento estable en el problema de ingeniería de tráfico.
Missing values appear in most multivariate time series, especially in the monitored network traffic data due to high measurement cost and unavoidable loss. In the networking fields, missing data prevents advanced analysis and downgrades downstream applications such as traffic engineering and anomaly detection. Despite the great potential, existing imputation approaches based on tensor decomposition and deep learning techniques have shown limitations in addressing missing values of traffic data due to its dynamic behavior. In this paper, we propose Graph Convolutional Recurrent Neural Network for Imputing Network Traffic (GCRINT), a combination between Recurrent Neural Network (RNN) and Graph Convolutional Neural Network, for filling the missing values of network traffic data. We use a bidirectional Long Short-Term Memory network and Graph Neural Network to efficiently learn the spatial-temporal correlations in partially observed data. We conducted extensive experiments to evaluate our model by using two different datasets and various missing scenarios. The experiment results show that GCRINT achieves significantly low imputation errors and reduces the error by 35% compared to the state-of-the-art methods. GCRINT also helps to obtain a stable performance in the traffic engineering problem.
تظهر القيم المفقودة في معظم السلاسل الزمنية متعددة المتغيرات، خاصة في بيانات حركة مرور الشبكة المراقبة بسبب ارتفاع تكلفة القياس والخسارة التي لا مفر منها. في مجالات الشبكات، تمنع البيانات المفقودة التحليل المتقدم وتخفض مستوى التطبيقات النهائية مثل هندسة حركة المرور واكتشاف الحالات الشاذة. على الرغم من الإمكانات الكبيرة، أظهرت مناهج الاحتساب الحالية القائمة على تحليل الموتر وتقنيات التعلم العميق قيودًا في معالجة القيم المفقودة لبيانات حركة المرور بسبب سلوكها الديناميكي. في هذه الورقة، نقترح الشبكة العصبية التفافية المتكررة للرسم البياني لحساب حركة مرور الشبكة (GCRINT)، وهي مزيج بين الشبكة العصبية المتكررة (RNN) والشبكة العصبية التفافية للرسم البياني، لملء القيم المفقودة لبيانات حركة مرور الشبكة. نستخدم شبكة ذاكرة طويلة الأجل ثنائية الاتجاه وشبكة عصبية للرسم البياني لتعلم الارتباطات المكانية والزمانية بكفاءة في البيانات المرصودة جزئيًا. أجرينا تجارب مكثفة لتقييم نموذجنا باستخدام مجموعتي بيانات مختلفتين وسيناريوهات مختلفة مفقودة. تظهر نتائج التجربة أن GCRINT يحقق أخطاء إسناد منخفضة بشكل ملحوظ ويقلل الخطأ بنسبة 35 ٪ مقارنة بالطرق الحديثة. تساعد GCRINT أيضًا في الحصول على أداء مستقر في مشكلة هندسة المرور.
Artificial neural network, Tensor Decompositions and Applications in Multilinear Algebra, Artificial intelligence, Missing data, Recurrent neural network, Social Sciences, Transportation, Convolutional neural network, Anomaly detection, Graph, Real-time computing, Engineering, Theoretical computer science, Graph Convolutional Networks, Machine learning, FOS: Mathematics, Imputation (statistics), Data mining, Deep learning, Traffic Flow Prediction and Forecasting, Building and Construction, Computer science, Multivariate statistics, Computational Mathematics, Traffic generation model, Physical Sciences, Mathematics, Understanding Human Mobility Patterns
Artificial neural network, Tensor Decompositions and Applications in Multilinear Algebra, Artificial intelligence, Missing data, Recurrent neural network, Social Sciences, Transportation, Convolutional neural network, Anomaly detection, Graph, Real-time computing, Engineering, Theoretical computer science, Graph Convolutional Networks, Machine learning, FOS: Mathematics, Imputation (statistics), Data mining, Deep learning, Traffic Flow Prediction and Forecasting, Building and Construction, Computer science, Multivariate statistics, Computational Mathematics, Traffic generation model, Physical Sciences, Mathematics, Understanding Human Mobility Patterns
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 8 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Top 10% | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Top 10% |
