
handle: 11511/43620
Graph databases are flexible NoSQL databases used to efficiently store and querycomplex dataset. The problem of subgraph isomorphism, finding a pattern in a givengraph, is one of the biggest problem of graph databases. Therefore, the goal of thisstudy is to introduce a new approach called BB-Plus, which consists of heuristics tofind best matching order using the volatility and size of the database, the type andsize of the query as an input in order to improve the performance of the queries. BBPlusapproach trims candidate nodes at high level and effectively reduces the size ofthe problem. The approach is implemented using the Java programming language andgraph data structures of Neo4j GDBMS and compared to the state-of-the-art subgraphisomorphism algorithms, namely BB-Graph, Cypher, DualIso, GraphQL, TurboIsoand VF3 with three different dataset within the same programming environment. Theresults of the performance tests show that BB-Plus is an average on 10%, 37% and4% faster than the other algorithms based on different queries in public WorldCup,Pokec and non-public Population dataset, respectively.
Çizge veritabanları, karmaşık veri setlerini daha etkin bir şekilde depolama ve sorgulamada kullanılan esnek NoSQL veritabanlarıdır. Altçizge eşyapılılık problemi yani verilen bir çizgede örüntülerin bulunması ise çizge veritabanlarındaki en büyük problemlerden biridir. Bu nedenle bu çalışmanın amacı, sorgunun performanasını artırmak için veritabanın büyüyklüğü, değişkenliği, sorgunun büyüklüğü ve tipini girdi olarak alan sezgisel yöntemler kullanarak en iyi eşleşen sırayı bulan BB-Plus adında yeni bir yaklaşım sunmaktır. BB-Plus, üst seviyelerde aday düğümlerin eler ve arama uzayının boyutunun düşürür. Yaklaşım, Java programlama dili ve Neo4j çizge veri yapılarını kullanılarak geliştirilmiştir ve aynı programlama ortamında üç farklı boyutta veri seti kullanılarak güncel altçizge eşyapılılık algoritmaları olan BB-Graph, Cypher, DualIso, GraphQl, TurboIso ve VF3 ile karşılaştırılmıştır. BB-Plus, farklı sorgular baz alındığında diğer algoritmalardan kullanıma açık WorldCup, Pokec ve kullanıma açık olmayan Population veritabanlarında sırasıyla ortalama %10, %37 ve %4 daha hızlı çalışmaktadır.
162
Keywords: Subgraph Isomorpishm Problem, Graph Database, Matching Order Selection, Computer engineering., Neo4j, Computer Engineering and Computer Science and Control, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Keywords: Subgraph Isomorpishm Problem, Graph Database, Matching Order Selection, Computer engineering., Neo4j, Computer Engineering and Computer Science and Control, Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
