Downloads provided by UsageCounts
handle: 10757/344330
Cet article se concentre sur l'important problème de la recherche sémantique dans les bases de données textuelles (structurées, semi-structurées, NoSQL). Ce problème est apparu comme une extension nécessaire de la requête standard basée sur des mots-clés de confinement pour répondre aux besoins des utilisateurs dans les bases de données textuelles et les applications IR. Nous fournissons ici une nouvelle approche, appelée SemIndex, qui étend l'index inversé standard en construisant un graphe d'index inversé à couplage serré qui combine deux ressources principales : un réseau sémantique à usage général et un index inversé standard sur une collection de données textuelles. Nous fournissons également un modèle de requête étendu et des algorithmes de traitement associés à l'aide de SemIndex. Pour étudier son efficacité, nous avons mis en place des expériences pour tester la performance de SemIndex. Les résultats préliminaires ont démontré l'efficacité, l'évolutivité et l'optimalité de notre approche.
Este documento se centra en el importante problema de la búsqueda semántica en bases de datos textuales (estructuradas, semiestructuradas, NoSQL). Este problema ha surgido como una extensión necesaria de la consulta basada en palabras clave de contención estándar para satisfacer las necesidades del usuario en bases de datos textuales y aplicaciones de IR. Proporcionamos aquí un nuevo enfoque, llamado SemIndex, que amplía el índice invertido estándar mediante la construcción de un gráfico de índice invertido de acoplamiento estrecho que combina dos recursos principales: una red semántica de propósito general y un índice invertido estándar en una colección de datos textuales. También proporcionamos un modelo de consulta extendido y algoritmos de procesamiento relacionados con la ayuda de SemIndex. Para investigar su efectividad, configuramos experimentos para probar el rendimiento de SemIndex. Los resultados preliminares han demostrado la eficacia, escalabilidad y optimización de nuestro enfoque.
This paper focuses on the important problem of semantic-aware search in textual (structured, semi-structured, NoSQL) databases. This problem has emerged as a required extension of the standard containment keyword based query to meet user needs in textual databases and IR applications. We provide here a new approach, called SemIndex, that extends the standard inverted index by constructing a tight coupling inverted index graph that combines two main resources: a general purpose semantic network, and a standard inverted index on a collection of textual data. We also provide an extended query model and related processing algorithms with the help of SemIndex. To investigate its effectiveness, we set up experiments to test the performance of SemIndex. Preliminary results have demonstrated the effectiveness, scalability and optimality of our approach.
تركز هذه الورقة على المشكلة المهمة المتمثلة في البحث الواعي الدلالي في قواعد البيانات النصية (المنظمة، شبه المنظمة، NoSQL). ظهرت هذه المشكلة كامتداد مطلوب للاستعلام القياسي القائم على الكلمات الرئيسية للاحتواء لتلبية احتياجات المستخدم في قواعد البيانات النصية وتطبيقات الأشعة تحت الحمراء. نقدم هنا نهجًا جديدًا، يسمى SemIndex، يوسع الفهرس المقلوب القياسي من خلال إنشاء رسم بياني مقلوب محكم الاقتران يجمع بين مصدرين رئيسيين: شبكة دلالية للأغراض العامة، وفهرس مقلوب قياسي على مجموعة من البيانات النصية. كما نقدم نموذج استعلام موسع وخوارزميات معالجة ذات صلة بمساعدة SemIndex. للتحقق من فعاليتها، قمنا بإعداد تجارب لاختبار أداء SemIndex. أظهرت النتائج الأولية فعالية نهجنا وقابليته للتطوير وأمثلته.
Data Stream Management Systems and Techniques, Computer Networks and Communications, Trajectory Data Mining and Analysis, Column-oriented Database Systems, Search engine indexing, Set (abstract data type), [INFO] Computer Science [cs], Query Optimization, Graph, Semantic Network, Database, Theoretical computer science, Artificial Intelligence, NoSQL indexing, Ontologies, Information retrieval, Inverted index, Data mining, Semantic Web, Relational Database Systems, Extension (predicate logic), Inverted lndex, Scalability, Semantic Queries, NoSQL, Computer science, Programming language, World Wide Web, Computer Science, Physical Sciences, Signal Processing, Semantic Web and Ontology Development, Index (typography)
Data Stream Management Systems and Techniques, Computer Networks and Communications, Trajectory Data Mining and Analysis, Column-oriented Database Systems, Search engine indexing, Set (abstract data type), [INFO] Computer Science [cs], Query Optimization, Graph, Semantic Network, Database, Theoretical computer science, Artificial Intelligence, NoSQL indexing, Ontologies, Information retrieval, Inverted index, Data mining, Semantic Web, Relational Database Systems, Extension (predicate logic), Inverted lndex, Scalability, Semantic Queries, NoSQL, Computer science, Programming language, World Wide Web, Computer Science, Physical Sciences, Signal Processing, Semantic Web and Ontology Development, Index (typography)
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 6 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
| views | 4 | |
| downloads | 5 |

Views provided by UsageCounts
Downloads provided by UsageCounts