Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Applied Artificial I...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
Applied Artificial Intelligence
Article . 2022 . Peer-reviewed
License: CC BY
Data sources: Crossref
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
Applied Artificial Intelligence
Article . 2022
Data sources: DOAJ
https://dx.doi.org/10.60692/4k...
Other literature type . 2022
Data sources: Datacite
https://dx.doi.org/10.60692/d4...
Other literature type . 2022
Data sources: Datacite
DBLP
Article
Data sources: DBLP
versions View all 5 versions
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Analysis of Proposed and Traditional Boosting Algorithm with Standalone Classification Methods for Classifying Gene Expresssion Microarray Data Using a Reject Option

تحليل خوارزمية التعزيز المقترحة والتقليدية مع طرق التصنيف المستقلة لتصنيف بيانات المصفوفة الدقيقة للتعبير الجيني باستخدام خيار الرفض
Authors: Adil Aslam Mir; Lal Hussain; Muhammad Waseem; Amjad Aldweesh; Saim Rasheed; El Sayed Yousef; Malik Sajjad Ahmed Nadeem; +1 Authors

Analysis of Proposed and Traditional Boosting Algorithm with Standalone Classification Methods for Classifying Gene Expresssion Microarray Data Using a Reject Option

Abstract

Dans le domaine médical, des décisions précises sont très importantes car elles risquent des vies humaines. Le système d'aide à la décision (SAD) joue un rôle important dans la prise de décisions précises et est utilisé pour la classification/prédiction. Dans l'analyse de l'expression génique, les gènes ne sont pas seulement gonflés par les conditions environnementales externes, mais aussi les valeurs d'expression de certains gènes sont affectées (comme le cancer, l'obésité, etc.). Dans cette étude, diverses méthodes traditionnelles (machine vectorielle de soutien, arbres de décision et analyse discriminante linéaire, Bayes naïve, régression logistique et perceptron multicouche) et proposées (combinaison de classificateurs traditionnels avec ensemble et probabilistes) sont utilisées afin d'effectuer la classification et l'analyse prédictive. Dans cette étude, nous avons utilisé les ensembles de données accessibles au public comprenant la lymphoïde, la leucémie et le cancer du côlon. La performance de classification sur l'ensemble de données Colon avec les méthodes traditionnelles a été obtenue avec précision (56%) et les méthodes d'ensemble probabilistes proposées avec précision (88%). Pour l'ensemble de données, Leucémie, la précision a été obtenue en utilisant des méthodes traditionnelles (78%) et des méthodes proposées (92%). De même, sur l'ensemble de données lymphoïdes, les méthodes traditionnelles ont donné une précision (75%) et les méthodes proposées (87%). Les résultats ont révélé que les méthodes proposées permettaient d'améliorer les performances de détection. Les méthodes proposées peuvent être utilisées comme un meilleur prédicteur pour un diagnostic précoce et un diagnostic amélioré pour améliorer les systèmes de santé.

En el campo de la medicina, las decisiones precisas son muy importantes, ya que ponen en riesgo vidas humanas. El sistema de apoyo a las decisiones (DSS) desempeña un papel importante en la toma de decisiones precisas y se utiliza para la clasificación/predicción. En el análisis de la expresión génica, los genes no solo están inflados por las condiciones ambientales externas, sino que también se ven afectados los valores de expresión de ciertos genes (como el cáncer, la obesidad, etc.). En este estudio, se utilizan varios métodos tradicionales (máquina de vectores de soporte, árboles de decisión y análisis discriminante lineal, Bayes ingenuo, regresión logística y perceptrón multicapa) y propuestos (combinación de clasificadores tradicionales con conjuntos y probabilísticos) para realizar la clasificación y el análisis de predicción. En este estudio utilizamos los conjuntos de datos disponibles públicamente compuestos por Linfoide, Leucemia y Cáncer de Colon. El rendimiento de la clasificación en el conjunto de datos de colon con métodos tradicionales se obtuvo con precisión (56%) y los métodos de conjunto probabilístico propuestos con precisión (88%). Para el conjunto de datos, Leucemia, la precisión se obtuvo utilizando métodos tradicionales (78%) y métodos propuestos (92%). Del mismo modo, en el conjunto de datos linfoides, los métodos tradicionales produjeron precisión (75%) y los métodos propuestos (87%). Los resultados revelaron que los métodos propuestos produjeron un mejor rendimiento de detección. Los métodos propuestos se pueden utilizar como un mejor predictor para el diagnóstico precoz y un mejor diagnóstico para mejorar los sistemas de salud.

In medical field, accurate decisions are very important as they risk human lives. decision support system (DSS) plays important role in making accurate decisions and used for classification/prediction. In gene expression analysis, genes are not only inflated by the external environmental conditions but also the expression values of certain genes are affected (like cancer, obesity etc). in this study, various traditional (Support Vector Machine, Decision Trees, and Linear Discriminant Analysis, naïve Bayes, logistic regression, and multilayer perceptron) and proposed methods (combination of traditional with ensemble and probabilistic classifiers) are used in order to perform the classification and prediction analysis. In this study we used the publicly available datasets comprised of Lymphoid, Leukemia and Colon Cancer. The classification performance on Colon dataset with traditional methods was obtained with accuracy (56%) and proposed probabilistic ensemble methods with accuracy (88%). For dataset, Leukemia, the accuracy was obtained using traditional methods (78%) and proposed methods (92%). Similarly, on Lymphoid dataset, the traditional methods yielded accuracy (75%) and proposed methods (87%). The results revealed that proposed methods yielded the improved detection performance. The proposed methods can be used as a better predictor for early diagnosis and improved diagnosis to improve the healthcare systems.

في المجال الطبي، تعد القرارات الدقيقة مهمة للغاية لأنها تعرض حياة الإنسان للخطر. يلعب نظام دعم القرار (DSS) دورًا مهمًا في اتخاذ قرارات دقيقة ويستخدم للتصنيف/التنبؤ. في تحليل التعبير الجيني، لا تتضخم الجينات بسبب الظروف البيئية الخارجية فحسب، بل تتأثر أيضًا قيم التعبير لبعض الجينات (مثل السرطان والسمنة وما إلى ذلك). في هذه الدراسة، يتم استخدام العديد من الأساليب التقليدية (آلة ناقلات الدعم، وأشجار القرار، والتحليل التمييزي الخطي، وساذجة بايز، والانحدار اللوجستي، والإدراك متعدد الطبقات) والأساليب المقترحة (مزيج من المصنفات التقليدية مع المصنفات الجماعية والاحتمالية) من أجل إجراء تحليل التصنيف والتنبؤ. استخدمنا في هذه الدراسة مجموعات البيانات المتاحة للجمهور والمكونة من اللمفاويات وسرطان الدم وسرطان القولون. تم الحصول على أداء التصنيف على مجموعة بيانات القولون بالطرق التقليدية بدقة (56 ٪) وطرق المجموعة الاحتمالية المقترحة بدقة (88 ٪). بالنسبة لمجموعة البيانات، سرطان الدم، تم الحصول على الدقة باستخدام الطرق التقليدية (78 ٪) والطرق المقترحة (92 ٪). وبالمثل، في مجموعة البيانات اللمفاوية، أسفرت الطرق التقليدية عن دقة (75 ٪) وطرق مقترحة (87 ٪). وكشفت النتائج أن الأساليب المقترحة أسفرت عن تحسين أداء الكشف. يمكن استخدام الطرق المقترحة كمؤشر أفضل للتشخيص المبكر وتحسين التشخيص لتحسين أنظمة الرعاية الصحية.

Keywords

Data Analysis, Artificial neural network, Artificial intelligence, Support vector machine, Linear discriminant analysis, Gene Expression, Challenges and Innovations in Bioinformatics Education, Boosting (machine learning), Bayesian probability, Bayes' theorem, Biochemistry, Genetics and Molecular Biology, Support Vector Machines, Microarray Data Analysis and Gene Expression Profiling, Machine learning, Decision tree, Feature Selection, Molecular Biology, Data mining, Probabilistic logic, Perceptron, Prediction of Protein Subcellular Localization, Naive Bayes classifier, Life Sciences, QA75.5-76.95, Computer science, Electronic computers. Computer science, Q300-390, Cybernetics, Probabilistic classification

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    2
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
2
Average
Average
Average
gold