Analisis Sentimen Pada Ulasan Tempat Wisata Desa Ponggok Menggunakan Natural Language Processing

Authors

  • Anggun Berlian Agustina Universitas Duta Bangsa Surakarta
  • Hanifah Permatasari Universitas Duta Bangsa Surakarta
  • Joni Maulindar Universitas Duta Bangsa Surakarta

DOI:

https://doi.org/10.47701/s9qesx65

Keywords:

Analisis Sentimen, Natural Language Processing, IndoBERT, Ulasan Wisata, Streamlit

Abstract

Ulasan pengunjung di platform digital telah menjadi faktor krusial yang mempengaruhi reputasi destinasi wisata seperti Desa Ponggok. Namun, volume data ulasan yang masif dan bersifat informal menyulitkan analisis manual, sehingga diperlukan pendekatan komputasional untuk mengekstrak wawasan sentimen secara efektif. Penelitian ini bertujuan untuk merancang dan mengimplementasikan model analisis sentimen pada ulasan berbahasa Indonesia mengenai tempat wisata Desa Ponggok. Metode yang digunakan adalah fine-tuning model pre-trained berbasis Transformer, yaitu IndoBERT, yang unggul dalam pemahaman konteks bahasa alami. Proses penelitian mencakup pengumpulan data dari Google Reviews, pra- pemrosesan data termasuk penanganan class imbalance dengan RandomOverSampler, pelatihan model, dan evaluasi menggunakan confusion matrix, akurasi, presisi, recall, serta F1-score. Hasil evaluasi pada data uji menunjukkan akurasi keseluruhan sebesar 79% dan F1-score 0.87 untuk kelas positif, namun menghadapi tantangan pada kelas netral dan negatif. Model yang telah dilatih kemudian berhasil diimplementasikan ke dalam sebuah aplikasi web interaktif menggunakan framework Streamlit, yang memungkinkan para pemangku kepentingan untuk melakukan inferensi sentimen secara langsung dan memvalidasi kegunaan praktis dari model.

References

[1] B. Armutcu, A. Tan, M. Amponsah, S. Parida, dan H. Ramkissoon, “Tourist behaviour: The role of digital marketing and social media,” Acta Psychologica, vol. 240, hlm. 104025, Okt 2023, doi: 10.1016/j.actpsy.2023.104025.

[2] X. (Simon) Hu dan Y. Yang, “What makes online reviews helpful in tourism and hospitality? a bare-bones meta-analysis,” Journal of Hospitality Marketing & Management, vol. 30, no. 2, hlm. 139– 158, Feb 2021, doi: 10.1080/19368623.2020.1780178.

[3] C. W. Park, I. Sutherland, dan S. K. Lee, “Effects of online reviews, trust, and picture-superiority on intention to purchase restaurant services,” Journal of Hospitality and Tourism Management, vol. 47, hlm. 228–236, Jun 2021, doi: 10.1016/j.jhtm.2021.03.007.

[4] J. R. Jim, M. A. R. Talukder, P. Malakar, M. M. Kabir, K. Nur, dan M. F. Mridha, “Recent advancements and challenges of NLP- based sentiment analysis: A state-of-the-art review,” Natural

Language Processing Journal, vol. 6, hlm. 100059, Mar 2024, doi: 10.1016/j.nlp.2024.100059.

[5] R. Imamguluyev, “The Rise of GPT-3: Implications for Natural Language Processing and Beyond,” Int. J. Res. Publ. Rev., vol. 4, no. 3, hlm. 4893–4903, Mar 2023, doi: 10.55248/gengpi.2023.4.33987.

[6] K. Anwar, “Analisa sentimen Pengguna Instagram Di Indonesia Pada Review Smartphone Menggunakan Naive Bayes,” klik, vol. 2, no. 4, hlm. 148–155, Feb 2022, doi: 10.30865/klik.v2i4.315.

[7] F. A. Larasati, D. E. Ratnawati, dan B. T. Hanggara, “Analisis Sentimen Ulasan Aplikasi Dana dengan Metode Random Forest,” 2022.

[8] E. Indrayuni, A. Nurhadi, dan D. A. Kristiyanti, “Implementasi Algoritma Naive Bayes, Support Vector Machine, dan K-Nearest Neighbors untuk Analisa Sentimen Aplikasi Halodoc,” FaktorExacta, vol. 14, no. 2, hlm. 64, Agu 2021, doi: 10.30998/faktorexacta.v14i2.9697.

[9] A. Karanikola, G. Davrazos, C. M. Liapis, dan S. Kotsiantis, “Financial sentiment analysis: Classic methods vs. deep learning models,” IDT, vol. 17, no. 4, hlm. 893–915, Nov 2023, doi: 10.3233/IDT-230478.

[10] M. Zhou, N. Duan, S. Liu, dan H.-Y. Shum, “Progress in Neural NLP: Modeling, Learning, and Reasoning,” Engineering, vol. 6, no. 3, hlm. 275–290, Mar 2020, doi: 10.1016/j.eng.2019.12.014.

[11] M. Wankhade, A. C. S. Rao, dan C. Kulkarni, “A survey on sentiment analysis methods, applications, and challenges,” Artif Intell Rev, vol. 55, no. 7, hlm. 5731–5780, Okt 2022, doi: 10.1007/s10462-022-10144-1.

[12] M. V. Koroteev, “BERT: A Review of Applications in Natural Language Processing and Understanding,” 2021, arXiv. doi: 10.48550/ARXIV.2103.11943.

[13] F. Koto, A. Rahimi, J. H. Lau, dan T. Baldwin, “IndoLEM and IndoBERT: A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP,” 2020, arXiv. doi: 10.48550/ARXIV.2011.00677.

[14] L. Kent, C. Snider, J. Gopsill, dan B. Hicks, “Mixed reality in design prototyping: A systematic review,” Design Studies, vol. 77, hlm. 101046, Nov 2021, doi: 10.1016/j.destud.2021.101046.

[15] R. Wasik, “The Advantages & Disadvantages of Prototyping - Rapids Reproductions,” The Advantages & Disadvantages of Prototyping. Diakses: 6 Juni 2025. [Daring]. Tersedia pada: https://rapidsrepro.com/advantages-disadvantages-prototyping/

[16] Y. Akkem, B. S. Kumar, dan A. Varanasi, “Streamlit Application for Advanced Ensemble Learning Methods in Crop Recommendation Systems – A Review and Implementation,” IJST, vol. 16, no. 48, hlm. 4688–4702, Des 2023, doi: 10.17485/IJST/v16i48.2850.

[17] A. Metonosa Afinda, “Lexicon Dataset.” https://github.com/angelmetanosaa/dataset, Github, 12 Juni 2025. Diakses: 12 Juni 2025. [Daring]. Tersedia pada: https://github.com/angelmetanosaa/dataset

Downloads

Published

2025-07-26