
Kehadiran Machine Learning (ML) di ruang lingkup komputasi modern telah menyebabkan banyak permasalahan dan solusi, terutama pembahasan algoritma. Penelitian ini menganalisa dan eksplorasi efektifitas lima algoritma ML dalam mengklasifikasi asam amino lazim esensial pada protein berdasarkan strukur molekul dan jumlah atom. Dataset diambil secara manual dari buku kimia organik klasik, yang dikonversi dari rumus dan gambar struktur senyawa asam amino lazim menjadi fitur numerik seperti jumlah atom karbon, hidrogen, nitrogen, oksigen, dan sulfur. Kelima algoritma ML yang dianalisis yakni Decision Tree, Gaussian Naive Bayes, K-Nearest Neighbour (KNN), K-Means, dan Random Forest. Setiap algoritma dilakukan evaluasi menggunakan nilai akurasi, precision, recall, F1-score, serta Area Under the Curve (AUC) dari kurva Receiver Operating Characteristic (ROC). Hasil menunjukkan bahwa algoritma Decision Tree, Random Forest, dan KNN memiliki tingkat akurasi terbaik dengan skor AUC sebesar 0,83. Studi kasus penelitian ini menawarkan pendekatan pengubahan data mentah menjadi fitur yang bisa dimengerti oleh algoritma ML dan klasifikasi biner dengan label nol dan satu pada dataset berskala kecil. Penelitian berikutnya disarankan menggunakan dataset yang lebih besar dan menerapkan validasi silang untuk meningkatkan generalisasi model.
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
