
<script type="text/javascript">
<!--
document.write('<div id="oa_widget"></div>');
document.write('<script type="text/javascript" src="https://www.openaire.eu/index.php?option=com_openaire&view=widget&format=raw&projectId=undefined&type=result"></script>');
-->
</script>
La popularité croissante des réseaux sociaux géolocalisés (LBSN) et l'enrichissement sémantique des données de mobilité dans plusieurs contextes au cours des dernières années ont conduit à la génération de grands volumes de données de trajectoire. Contrairement aux trajectoires basées sur le GPS, les trajectoires LBSN et sensibles au contexte sont des données plus complexes, ayant plusieurs dimensions textuelles sémantiques en plus de l'espace et du temps, ce qui peut révéler des modèles de mobilité intéressants. Par exemple, les gens peuvent visiter différents endroits ou effectuer différentes activités en fonction des conditions météorologiques. Ces nouvelles données sémantiquement riches, connues sous le nom de trajectoires à aspects multiples, posent de nouveaux défis dans la classification des trajectoires, qui est le problème que nous abordons dans cet article. Les méthodes existantes de classification de trajectoire ne peuvent pas traiter la complexité des dimensions de données hétérogènes ou l'aspect séquentiel qui caractérise le mouvement. Dans cet article, nous proposons MARC, une approche basée sur l'intégration d'attributs et les réseaux neuronaux récurrents (RNN) pour classer les trajectoires à aspects multiples, qui aborde toutes les propriétés de la trajectoire : espace, temps, sémantique et séquence. Nous soulignons que MARC présente de bonnes performances, en particulier lorsque les trajectoires sont décrites par plusieurs attributs textuels/catégoriques. Les expériences réalisées sur quatre ensembles de données accessibles au public en tenant compte du problème de liaison TRAJECTOIRE-UTILISATEUR (TUL) montrent que MARC a surpassé tous les concurrents, en ce qui concerne la précision, la précision, le rappel et le score F1.
La creciente popularidad de las redes sociales basadas en la ubicación (LBSN) y el enriquecimiento semántico de los datos de movilidad en varios contextos en los últimos años ha llevado a la generación de grandes volúmenes de datos de trayectoria. En contraste con las trayectorias basadas en GPS, las trayectorias LBSN y conscientes del contexto son datos más complejos, que tienen varias dimensiones textuales semánticas además del espacio y el tiempo, lo que puede revelar patrones de movilidad interesantes. Por ejemplo, las personas pueden visitar diferentes lugares o realizar diferentes actividades dependiendo de las condiciones climáticas. Estos nuevos datos semánticamente ricos, conocidos como trayectorias de múltiples aspectos, plantean nuevos desafíos en la clasificación de trayectorias, que es el problema que abordamos en este artículo. Los métodos existentes para la clasificación de trayectorias no pueden abordar la complejidad de las dimensiones heterogéneas de los datos o el aspecto secuencial que caracteriza el movimiento. En este trabajo proponemos MARC, un enfoque basado en la incorporación de atributos y las Redes Neuronales Recurrentes (RNN) para clasificar trayectorias de múltiples aspectos, que aborda todas las propiedades de la trayectoria: espacio, tiempo, semántica y secuencia. Destacamos que MARC muestra un buen rendimiento, especialmente cuando las trayectorias se describen mediante varios atributos textuales/categóricos. Los experimentos realizados en cuatro conjuntos de datos disponibles públicamente teniendo en cuenta el problema de la vinculación trayectoria-usuario (TUL) muestran que MARC superó a todos los competidores, con respecto a la precisión, la precisión, la recuperación y la puntuación F1.
The increasing popularity of Location-Based Social Networks (LBSNs) and the semantic enrichment of mobility data in several contexts in the last years has led to the generation of large volumes of trajectory data. In contrast to GPS-based trajectories, LBSN and context-aware trajectories are more complex data, having several semantic textual dimensions besides space and time, which may reveal interesting mobility patterns. For instance, people may visit different places or perform different activities depending on the weather conditions. These new semantically rich data, known as multiple-aspect trajectories, pose new challenges in trajectory classification, which is the problem that we address in this paper. Existing methods for trajectory classification cannot deal with the complexity of heterogeneous data dimensions or the sequential aspect that characterizes movement. In this paper we propose MARC, an approach based on attribute embedding and Recurrent Neural Networks (RNNs) for classifying multiple-aspect trajectories, that tackles all trajectory properties: space, time, semantics, and sequence. We highlight that MARC exhibits good performance especially when trajectories are described by several textual/categorical attributes. Experiments performed over four publicly available datasets considering the Trajectory-User Linking (TUL) problem show that MARC outperformed all competitors, with respect to accuracy, precision, recall, and F1-score.
أدت الشعبية المتزايدة للشبكات الاجتماعية القائمة على الموقع (LBSNs) والإثراء الدلالي لبيانات التنقل في عدة سياقات في السنوات الأخيرة إلى توليد كميات كبيرة من بيانات المسار. على النقيض من المسارات القائمة على نظام تحديد المواقع العالمي (GPS)، فإن LBSN والمسارات المدركة للسياق هي بيانات أكثر تعقيدًا، ولها العديد من الأبعاد النصية الدلالية إلى جانب المكان والزمان، والتي قد تكشف عن أنماط تنقل مثيرة للاهتمام. على سبيل المثال، قد يزور الناس أماكن مختلفة أو يؤدون أنشطة مختلفة اعتمادًا على الظروف الجوية. تشكل هذه البيانات الجديدة الغنية من الناحية الدلالية، والمعروفة باسم المسارات متعددة الجوانب، تحديات جديدة في تصنيف المسارات، وهي المشكلة التي نتناولها في هذه الورقة. لا يمكن للطرق الحالية لتصنيف المسار التعامل مع تعقيد أبعاد البيانات غير المتجانسة أو الجانب المتسلسل الذي يميز الحركة. في هذه الورقة، نقترح مارك، وهو نهج يعتمد على تضمين السمات والشبكات العصبية المتكررة (RNNs) لتصنيف المسارات متعددة الجوانب، والتي تتناول جميع خصائص المسار: المكان والزمان والدلالات والتسلسل. نسلط الضوء على أن مارك يظهر أداءً جيدًا خاصة عندما يتم وصف المسارات من خلال العديد من السمات النصية/الفئوية. تُظهر التجارب التي أجريت على أربع مجموعات بيانات متاحة للجمهور مع الأخذ في الاعتبار مشكلة ربط المستخدم بالمسار (TUL) أن مارك تفوق على جميع المنافسين، فيما يتعلق بالدقة والدقة والاستدعاء ودرجة F1.
Artificial intelligence, Semantic Trajectories, Astronomy, Trajectory Data Mining and Analysis, Geography, Planning and Development, Categorical variable, Recurrent neural network, Trajectory, Social Sciences, Transportation, Location-Based Data, Context (archaeology), Machine learning, Data mining, Geography, Social Sensing, Physics, Geohash embedding, Semantics (computer science), Computer science, Programming language, Archaeology, Trajectory Data Mining, Signal Processing, Computer Science, Physical Sciences, Multiple-aspect trajectory, Transportation Modes, Semantic trajectory classification, Volunteered Geographic Information and Geospatial Crowdsourcing, Trajectory classification, Understanding Human Mobility Patterns, Embedding
Artificial intelligence, Semantic Trajectories, Astronomy, Trajectory Data Mining and Analysis, Geography, Planning and Development, Categorical variable, Recurrent neural network, Trajectory, Social Sciences, Transportation, Location-Based Data, Context (archaeology), Machine learning, Data mining, Geography, Social Sensing, Physics, Geohash embedding, Semantics (computer science), Computer science, Programming language, Archaeology, Trajectory Data Mining, Signal Processing, Computer Science, Physical Sciences, Multiple-aspect trajectory, Transportation Modes, Semantic trajectory classification, Volunteered Geographic Information and Geospatial Crowdsourcing, Trajectory classification, Understanding Human Mobility Patterns, Embedding
citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 55 | |
popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Top 1% | |
influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Top 10% | |
impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Top 10% |
views | 7 | |
downloads | 34 |