Perbandingan Algoritma Random Forest dan Naive Bayes dalam Memprediksi Penyakit Diabetes
Keywords:
Machine Learning, Perbandingan, Random Forest, Naive Bayes, DiabetesAbstract
Diabetes adalah penyakit kronis yang memberikan dampak signifikan terhadap kesehatan masyarakat global. Penyakit ini menjadi salah satu penyebab utama kematian di dunia dengan komplikasi serius seperti penyakit kardiovaskular, gagal ginjal, neuropati, dan kebutaan. Selain dampak kesehatan, diabetes juga menimbulkan beban ekonomi yang besar, baik bagi individu maupun sistem kesehatan. Oleh karena itu, deteksi dini menjadi langkah penting untuk meningkatkan kualitas hidup pasien, mencegah komplikasi, dan mengurangi biaya pengobatan jangka panjang. Penelitian ini bertujuan untuk membandingkan kinerja algoritma Random Forest dan Naive Bayes dalam memprediksi risiko diabetes menggunakan dataset kesehatan. Dataset yang digunakan mencakup 768 data pasien dengan berbagai parameter, seperti kadar glukosa, tekanan darah, indeks massa tubuh (BMI), usia, serta faktor risiko lainnya. Dataset ini dibagi menjadi data latih (80%) dan data uji (20%) secara acak untuk memastikan validitas model. Proses penelitian melibatkan tahapan prapemrosesan data, implementasi algoritma, dan evaluasi performa menggunakan metrik seperti Accuracy, Precision, Recall, dan F1-score. Hasil penelitian menunjukkan bahwa algoritma Naive Bayes memberikan akurasi lebih tinggi (77%) dibandingkan Random Forest (72%). Selain itu, Naive Bayes lebih unggul dalam mendeteksi kasus positif diabetes, seperti tercermin pada metrik Precision, Recall, dan F1-score yang lebih baik. Penelitian ini diharapkan berkontribusi pada pengembangan sistem deteksi dini berbasis data yang lebih andal dan akurat. Selain itu, penelitian lanjutan dapat mengeksplorasi algoritma lain, seperti XGBoost atau Gradient Boosting, untuk meningkatkan performa lebih lanjut.