Diagnosis Penyakit Hepatitis Menggunakan Fuzzy K-NN dan Ensemble Learning

Authors

  • Ery Permana Yudha Univer
  • Eko Purwanto Universitas Duta Bangsa Surakarta
  • Joni Maulindar Universitas Duta Bangsa Surakarta

Keywords:

Hepatitis, fuzzy k-nn, ensemble learning, bagging, boosting

Abstract

Penyakit hepatitis adalah satu diantara lima penyakit yang paling mematikan. Hepatitis menyerang organ hati yang diakibatkan oleh serangan virus. Penyakit hepatitis merupakan masalah kesehatan global yang mempengaruhi jutaan orang di seluruh dunia. Deteksi dini dan pengklasifikasian yang akurat dari penyakit hepatitis sangat penting untuk pengelolaan dan perawatan yang tepat. Dalam artikel ini, kami mengusulkan sebuah sistem deteksi penyakit hepatitis yang menggunakan kombinasi metode Fuzzy k-NN dan Ensemble Learning. Pendekatan ini bertujuan untuk meningkatkan akurasi dan kehandalan dalam diagnosis hepatitis. Metode klasifikasi yang tepat dan data informasi yang lengkap dapat membantu dalam mendeteksi kemungkinan harapan hidup seseorang yang terkena penyakit hepatitis. Oleh karena itu kami mengusulkan untuk menggunakan gabungan metode yang merupakan gabungan dari Fuzzy K-NN dengan ensemble learning. Ensemble learning yang digunakan pada penelitian ini adalah ensemble bagging dan adaptive boosting. Ensemble learning digunakan untuk meningkatkan akurasi dari Fuzzy K-NN untuk memprediksi kemungkinan harapan hidup seseorang yang terkena penyakit hepatitis. Sebelum dilakukan metode klasifikasi dilakukan preprocessing terhadap dataset hepatitis dengan mengisi missing value dan menyeimbangkan data dengan menggunakan metode Synthetic Minority Oversampling Technique (SMOTE) borderline. Hasil uji coba pada penelitian ini menunjukkan bahwa metode yang diusulkan mendapatkan rata-rata akurasi sebesar 94,87% dan melebihi kinerja dari metode lain yang digunakan sebagai bahan uji.

References

M. Rouhani and M. M. Haghighi, “The diagnosis of hepatitis diseases by support vector machines and artificial neural networks,” 2009 Int. Assoc. Comput. Sci. Inf. Technol. - Spring Conf. IACSIT-SC 2009, pp. 456–458, 2009.

M. Zeng, B. Zou, F. Wei, X. Liu, and L. Wang, “Effective prediction of three common diseases by combining SMOTE with Tomek links technique for imbalanced medical data,” Proc. 2016 IEEE Int. Conf. Online Anal. Comput. Sci. ICOACS 2016, vol. 2016, pp. 225–228, 2016.

H. L. Chen et al., “An efficient diagnosis system for detection of Parkinson’s disease using fuzzy k-nearest neighbor approach,” Expert Syst. Appl., vol. 40, no. 1, pp. 263–271, 2013.

C. B. C. Latha and S. C. Jeeva, “Improving the accuracy of prediction of heart disease risk based on ensemble classification techniques,” Informatics Med. Unlocked, vol. 16, no. June, p. 100203, 2019.

H. Ghaderi Zefrehi and H. Altınçay, “Imbalance learning using heterogeneous ensembles,” Expert Syst. Appl., vol. 142, 2020.

Chawla, N. V. , Lazarevic, A. , Hall, L. O. , & Bowyer, K. (2003). SMOTEBoost: Improving prediction of the minority class in boosting. In Knowledge discovery in databases: PKDD 2003 (pp. 107–119). Springer Berlin Heidelberg .

Lertampaiporn, S. , Thammarongtham, C. , Nukoolkit, C. , Kaewkamnerdpong, B. , & Ru- engjitchatchawalya, M. (2013). Heterogeneous ensemble approach with discrim- inative features and modified-smotebagging for pre-mirna classification. Nucleic Acids Research, 41 .

Galar, M. , Fernandez, A. , Barrenechea, E. , Bustince, H. , & Herrer, F. (2012). A review on ensembles for the class imbalance problem: bagging, boosting, and hybrid-based approaches. IEEE Transactions on Systems Man and Cybernetics Part C, 42 , 463–484 .

Wang, S. , & Yao, X. (2009). Diversity analysis on imbalanced data sets by using ensemble models. In IEEE Symposium on Computational Intelligence and Data Mining, CIDM 2009 (pp. 324–331) .

Panigrahi, S., Kundu, A., Sural, S., & Majumdar, A. (2009). Credit card fraud detection: a fusion approach using dempster-shafer theory and bayesian learning. Information Fusion, 10 , 354–363. doi: 10.1016/j.inffus.20 08.04.0 01 .

Lu, X.-Y. , Chen, M.-S. , Wu, J.-L. , Chang, P.-C. , & Chen, Z. (2018). A novel ensemble decision tree based on under-sampling and clonal selection for web spam detection. Pattern Analysis and Applications, 21 , 741–754 .

Wang, S. , & Yao, X. (2013). Using class imbalance learning for software defect prediction. IEEE Transactions on Reliability, 62 , 434–443 .

O. Dogan and B. Oztaysi, “Genders prediction from indoor customer paths by Levenshtein-based fuzzy kNN,” Expert Syst. Appl., vol. 136, pp. 42–49, 2019

M. R. Nikoo, R. Kerachian, and M. R. Alizadeh, “A fuzzy KNN-based model for significant wave height prediction in large lakes,” Oceanologia, vol. 60, no. 2, pp. 153–168, 2018.

Published

2023-07-25