Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ IEEE Accessarrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
IEEE Access
Article . 2021 . Peer-reviewed
License: CC BY
Data sources: Crossref
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
IEEE Access
Article
License: CC BY NC ND
Data sources: UnpayWall
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
IEEE Access
Article . 2021
Data sources: DOAJ
https://dx.doi.org/10.60692/yf...
Other literature type . 2021
Data sources: Datacite
https://dx.doi.org/10.60692/yw...
Other literature type . 2021
Data sources: Datacite
versions View all 4 versions
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

bSSA: Binary Salp Swarm Algorithm With Hybrid Data Transformation for Feature Selection

bSSA: خوارزمية سرب SALP الثنائية مع تحويل البيانات الهجينة لاختيار الميزات
Authors: Sayar Singh Shekhawat; Harish Sharma; Sandeep Kumar; Anand Nayyar; Basit Qureshi;

bSSA: Binary Salp Swarm Algorithm With Hybrid Data Transformation for Feature Selection

Abstract

La sélection de fonctionnalités est une technique couramment utilisée dans l'exploration de données et l'apprentissage automatique. Les méthodes traditionnelles de sélection de caractéristiques, lorsqu'elles sont appliquées à de grands ensembles de données, génèrent un grand nombre de sous-ensembles de caractéristiques. La sélection de fonctionnalités optimales dans cet espace de données de haute dimension prend du temps et affecte négativement les performances du système. Cet article propose un nouvel algorithme binaire Salp Swarm (bSSA) pour sélectionner le meilleur ensemble de fonctionnalités à partir d'ensembles de données transformés. La méthode de sélection de caractéristiques proposée transforme d'abord l'ensemble de données d'origine à l'aide de méthodes de transformation de données hybrides basées sur l'analyse en composantes principales (PCA) et l'analyse en composantes indépendantes (FastICA) ; ensuite, un optimiseur binaire Salp Swarm est utilisé pour trouver les meilleures caractéristiques. L'approche de sélection de caractéristiques proposée améliore la précision et élimine la sélection de caractéristiques non pertinentes. Nous validons notre technique sur quinze ensembles de données de référence différents. Nous menons une étude approfondie pour mesurer les performances et la précision de la sélection des caractéristiques de la technique proposée. Le bSSA proposé est comparé à Binary Genetic Algorithm (bGA), Binary Binomial Cuckoo Search (bBCS), Binary Grey Wolf Optimizer (bGWO), Binary Competitive Swarm Optimizer (bCSO) et Binary Crow Search Algorithm (bCSA). La méthode proposée atteint une précision moyenne de 95,26 % avec des caractéristiques de 7,78 % sur les ensembles de données transformés PCA-fastICA. Les résultats montrent que bSSA surpasse les méthodes existantes pour la majorité des mesures de performance.

La selección de características es una técnica comúnmente utilizada en la minería de datos y el aprendizaje automático. Los métodos tradicionales de selección de características, cuando se aplican a grandes conjuntos de datos, generan una gran cantidad de subconjuntos de características. La selección de características óptimas dentro de este espacio de datos de alta dimensión consume mucho tiempo y afecta negativamente al rendimiento del sistema. Este documento propone un nuevo algoritmo binario Salp Swarm (bSSA) para seleccionar el mejor conjunto de características a partir de conjuntos de datos transformados. El método de selección de características propuesto primero transforma el conjunto de datos original utilizando métodos de transformación de datos híbridos basados en análisis de componentes principales (PCA) y análisis de componentes independientes rápidos (fastICA); a continuación, se utiliza un optimizador binario Salp Swarm para encontrar las mejores características. El enfoque de selección de características propuesto mejora la precisión y elimina la selección de características irrelevantes. Validamos nuestra técnica en quince conjuntos de datos de referencia diferentes. Realizamos un extenso estudio para medir el rendimiento y la precisión de la selección de características de la técnica propuesta. La bSSA propuesta se compara con el algoritmo genético binario (bGA), la búsqueda binomial binaria de cuco (bBCS), el optimizador binario de lobo gris (bGWO), el optimizador binario de enjambre competitivo (bCSO) y el algoritmo binario de búsqueda de cuervo (bCSA). El método propuesto alcanza una precisión media del 95,26% con un 7,78% de características en los conjuntos de datos transformados PCA-fastICA. Los resultados muestran que bSSA supera los métodos existentes para la mayoría de las medidas de rendimiento.

Feature selection is a technique commonly used in Data Mining and Machine Learning. Traditional feature selection methods, when applied to large datasets, generate a large number of feature subsets. Selecting optimal features within this high dimensional data space is time-consuming and negatively affects the system's performance. This paper proposes a new binary Salp Swarm Algorithm (bSSA) for selecting the best feature set from transformed datasets. The proposed feature selection method first transforms the original data-set using Principal Component Analysis (PCA) and fast Independent Component Analysis (fastICA) based hybrid data transformation methods; next, a binary Salp Swarm optimizer is used for finding the best features. The proposed feature selection approach improves accuracy and eliminates the selection of irrelevant features. We validate our technique on fifteen different benchmark data sets. We conduct an extensive study to measure the performance and feature selection accuracy of the proposed technique. The proposed bSSA is compared to Binary Genetic Algorithm (bGA), Binary Binomial Cuckoo Search (bBCS), Binary Grey Wolf Optimizer (bGWO), Binary Competitive Swarm Optimizer (bCSO), and Binary Crow Search Algorithm (bCSA). The proposed method attains a mean accuracy of 95.26% with 7.78% features on PCA-fastICA transformed datasets. The results show that bSSA outperforms the existing methods for the majority of the performance measures.

اختيار الميزات هي تقنية شائعة الاستخدام في استخراج البيانات والتعلم الآلي. تولد طرق اختيار الميزات التقليدية، عند تطبيقها على مجموعات البيانات الكبيرة، عددًا كبيرًا من المجموعات الفرعية للميزات. إن اختيار الميزات المثلى داخل مساحة البيانات عالية الأبعاد هذه يستغرق وقتًا طويلاً ويؤثر سلبًا على أداء النظام. تقترح هذه الورقة خوارزمية ثنائية جديدة لسرب Salp (bSSA) لاختيار أفضل مجموعة ميزات من مجموعات البيانات المحولة. تقوم طريقة اختيار الميزة المقترحة أولاً بتحويل مجموعة البيانات الأصلية باستخدام طرق تحويل البيانات الهجينة القائمة على تحليل المكون الرئيسي (PCA) وتحليل المكون المستقل السريع (FastICA )؛ بعد ذلك، يتم استخدام محسن سرب ثنائي SALP للعثور على أفضل الميزات. يحسن نهج اختيار الميزات المقترح الدقة ويزيل اختيار الميزات غير ذات الصلة. نحن نتحقق من تقنيتنا على خمسة عشر مجموعة بيانات مرجعية مختلفة. نجري دراسة مكثفة لقياس أداء ودقة اختيار الميزات للتقنية المقترحة. تتم مقارنة bSSA المقترح بالخوارزمية الوراثية الثنائية (bGA)، وبحث الوقواق ثنائي الحدود (bBCS)، ومحسن الذئب الرمادي الثنائي (bGWO)، ومحسن السرب التنافسي الثنائي (bCSO)، وخوارزمية بحث الغراب الثنائي (bCSA). تحقق الطريقة المقترحة متوسط دقة بنسبة 95.26 ٪ مع ميزات 7.78 ٪ على مجموعات البيانات المحولة من PCA - fastICA. تظهر النتائج أن bSSA يتفوق على الأساليب الحالية لغالبية مقاييس الأداء.

Keywords

Artificial intelligence, principal component analysis, Feature (linguistics), Blind signal separation, Pattern recognition (psychology), Feature vector, Data transformation, feature selection, Engineering, FastICA, salp swarm optimizer, Feature Selection, Constraint Handling, Computer network, Geography, Spectral Clustering, Particle swarm optimization, FOS: Philosophy, ethics and religion, Algorithm, fast independent component analysis, Physical Sciences, Feature selection, Electrical engineering. Electronics. Nuclear engineering, Computer Vision and Pattern Recognition, Geodesy, Principal component analysis, Control Systems and Network Applications, Swarm behaviour, Artificial Intelligence, FOS: Mathematics, Swarm Intelligence Optimization Algorithms, Data mining, Arithmetic, Cuckoo search, Linguistics, Computer science, TK1-9971, Philosophy, Control and Systems Engineering, Particle Swarm Optimization, Channel (broadcasting), Computer Science, Nature-Inspired Algorithms, FOS: Languages and literature, Benchmark (surveying), Face Recognition and Dimensionality Reduction Techniques, Binary number, Mathematics

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    63
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Top 1%
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Top 10%
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Top 1%
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
63
Top 1%
Top 10%
Top 1%
gold