
La transformation des données est le processus de base lors de la migration d'une base de données relationnelle vers une base de données NoSQL telle qu'une base de données orientée colonne.Toutefois, il n'existe pas de directive standard pour la transformation des données d'une base de données relationnelle vers une base de données NoSQL.Un certain nombre de techniques de transformation de schéma ont été proposées pour améliorer le processus de transformation des données et ont entraîné un meilleur temps de traitement des requêtes par rapport au temps de traitement des requêtes de la base de données relationnelle.Toutefois, ces approches ont produit des tableaux redondants dans le schéma résultant qui, à leur tour, consomme une grande taille de stockage inutile et produit un temps de traitement de requête élevé en raison du schéma généré avec des familles de colonnes redondantes dans la base de données orientée colonne transformée. Dans cet article, une technique de transformation de données efficace de la base de données relationnelle à la base de données orientée colonne est proposée. La technique de transformation de schéma proposée est basée sur la combinaison de l'approche de dénormalisation, du modèle d'accès aux données et du schéma à imbrication multiple. Afin de valider le travail proposé, la technique proposée est mise en œuvre en transformant les données de la base de données MySQL à la base de données MongoDB. Une technique de transformation de référence est également effectuée dans laquelle le temps de traitement de requête et la taille de stockage sont comparés. résultats expérimentaux, la technique de transformation proposée a montré une amélioration significative en termes de temps de traitement des requêtes et d'utilisation de l'espace de stockage en raison du nombre réduit de familles de colonnes dans la base de données orientée colonne.
La transformación de datos es el proceso central en la migración de la base de datos de la base de datos relacional a la base de datos NoSQL, como la base de datos orientada a columnas. Sin embargo, no existe una guía estándar para la transformación de datos de la base de datos relacional a la base de datos NoSQL. Se han propuesto varias técnicas de transformación de esquemas para mejorar el proceso de transformación de datos y resultó en un mejor tiempo de procesamiento de consultas en comparación con el tiempo de procesamiento de consultas de la base de datos relacional. Sin embargo, estos enfoques produjeron tablas redundantes en el esquema resultante que a su vez consumir un gran tamaño de almacenamiento innecesario y producir un alto tiempo de procesamiento de consultas debido al esquema generado con familias de columnas redundantes en la base de datos orientada a columnas transformada. En este documento, se propone una técnica de transformación de datos eficiente de la base de datos relacional a la base de datos orientada a columnas. La técnica de transformación de esquemas propuesta se basa en la combinación del enfoque de desnormalización, el patrón de acceso a datos y el esquema anidado múltiple. Para validar el trabajo propuesto, la técnica propuesta se implementa transformando los datos de la base de datos MySQL a la base de datos MongoDB. También se realiza una técnica de transformación de puntos de referencia en la que se comparan el tiempo de procesamiento de consultas y el tamaño de almacenamiento. Basado en el resultados experimentales, la técnica de transformación propuesta mostró una mejora significativa en términos de tiempo de procesamiento de consultas y uso del espacio de almacenamiento debido a la reducción del número de familias de columnas en la base de datos orientada a columnas.
Data transformation is the core process in migrating database from relational database to NoSQL database such as column-oriented database.However, there is no standard guideline for data transformation from relational database to NoSQL database.A number of schema transformation techniques have been proposed to improve data transformation process and resulted better query processing time when compared to the relational database query processing time.However, these approaches produced redundant tables in the resulted schema that in turn consume large unnecessary storage size and produce high query processing time due to the generated schema with redundant column families in the transformed column-oriented database.In this paper, an efficient data transformation technique from relational database to column-oriented database is proposed.The proposed schema transformation technique is based on the combination of denormalization approach, data access pattern and multiple-nested schema.In order to validate the proposed work, the proposed technique is implemented by transforming data from MySQL database to MongoDB database.A benchmark transformation technique is also performed in which the query processing time and the storage size are compared.Based on the experimental results, the proposed transformation technique showed significant improvement in terms query processing time and storage space usage due to the reduced number of column families in the column-oriented database.
تحويل البيانات هو العملية الأساسية في ترحيل قاعدة البيانات من قاعدة البيانات العلائقية إلى قاعدة بيانات NoSQL مثل قاعدة البيانات الموجهة نحو الأعمدة. ومع ذلك، لا يوجد دليل توجيهي قياسي لتحويل البيانات من قاعدة البيانات العلائقية إلى قاعدة بيانات NoSQL. تم اقتراح عدد من تقنيات تحويل المخطط لتحسين عملية تحويل البيانات وأسفرت عن وقت معالجة استعلام أفضل عند مقارنتها بوقت معالجة استعلام قاعدة البيانات العلائقية. ومع ذلك، أنتجت هذه الأساليب جداول زائدة في المخطط الناتج الذي بدوره تستهلك حجم تخزين كبير غير ضروري وتنتج وقت معالجة استعلام كبير بسبب المخطط الذي تم إنشاؤه مع عائلات الأعمدة الزائدة في قاعدة البيانات الموجهة نحو الأعمدة المحولة. في هذه الورقة، يتم اقتراح تقنية تحويل بيانات فعالة من قاعدة البيانات العلائقية إلى قاعدة البيانات الموجهة نحو الأعمدة. تعتمد تقنية تحويل المخطط المقترحة على مزيج من نهج إلغاء التطبيع ونمط الوصول إلى البيانات والمخطط المتعدد التداخل. من أجل التحقق من صحة العمل المقترح، يتم تنفيذ التقنية المقترحة عن طريق تحويل البيانات من قاعدة بيانات MySQL إلى قاعدة بيانات MongoDB. كما يتم إجراء تقنية تحويل معيارية يتم فيها مقارنة وقت معالجة الاستعلام وحجم التخزين. بناءً على النتائج التجريبية، أظهرت تقنية التحويل المقترحة تحسنًا كبيرًا من حيث وقت معالجة الاستعلام واستخدام مساحة التخزين بسبب انخفاض عدد مجموعات الأعمدة في قاعدة البيانات الموجهة نحو الأعمدة.
FOS: Computer and information sciences, Data Quality Assessment and Improvement, Data Integration, Data Stream Management Systems and Techniques, Computer Networks and Communications, Column-oriented Database Systems, Social Sciences, Cloud Computing and Big Data Technologies, Management Science and Operations Research, Schema (genetic algorithms), Query Optimization, Schema migration, Decision Sciences, Semi-structured model, Database, Database schema, Data Cleaning, Relational database, Information retrieval, Data mining, Relational Database Systems, Scalability, NoSQL, Database design, Computer science, Database model, View, Computer Science, Physical Sciences, Telecommunications, Column (typography), Information Systems, Frame (networking)
FOS: Computer and information sciences, Data Quality Assessment and Improvement, Data Integration, Data Stream Management Systems and Techniques, Computer Networks and Communications, Column-oriented Database Systems, Social Sciences, Cloud Computing and Big Data Technologies, Management Science and Operations Research, Schema (genetic algorithms), Query Optimization, Schema migration, Decision Sciences, Semi-structured model, Database, Database schema, Data Cleaning, Relational database, Information retrieval, Data mining, Relational Database Systems, Scalability, NoSQL, Database design, Computer science, Database model, View, Computer Science, Physical Sciences, Telecommunications, Column (typography), Information Systems, Frame (networking)
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 4 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Top 10% | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Top 10% | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Top 10% |
