Opinion Mining Pada Review Produk Kecantikan Menggunakan Algoritma Naïve Bayes

Penulis

  • Dinda Ayu Muthia

DOI:

https://doi.org/10.51998/jsi.v7i1.203

Abstrak

Abstract— In recent years many sentiment analysis and opinion mining applications have been developed to analyze opinions, feelings and attitudes about products, brands, and news, etc. These applications mine opinions from different sources like online forums and news sites and from movie, product and hotel reviews. The Naïve Bayes algorithm is a popular machine learning technique for opinion mining, as it is very simple, efficient and performs well on many domains. However, Naïve Bayes has a deficiency that is very sensitive to features that are too numerous, resulting in low classification accuracy. Therefore, this research used Genetic Algorithm feature selection method to improve the accuracy of Naïve Bayes. This study produces text classification in the form of positive or negative from beauty product reviews. Measurements based on Naive Bayes accuracy before and after the addition of feature selection methods. The evaluation was performed using 10 fold cross validation. Measurement accuracy is measured with confusion matrix and ROC curve. The results showed an increase in the accuracy of Naïve Bayes from 65.50% to 83%.

Intisari— Dalam beberapa tahun terakhir banyak analisis sentimen dan aplikasi opinion mining telah dikembangkan untuk menganalisis pendapat, perasaan dan sikap tentang produk, merek, dan berita, dan sejenisnya. Aplikasi ini menambang pendapat dari berbagai sumber seperti forum online dan situs berita dan dari ulasan film, produk dan hotel. Algoritma Naïve Bayes adalah teknik machine learning yang populer untuk opinion mining, karena sangat sederhana, efisien dan memiliki performa yang baik pada banyak domain. Namun, Naïve Bayes memiliki kekurangan yaitu sangat sensitif pada fitur yang terlalu banyak, yang mengakibatkan akurasi klasifikasi menjadi rendah. Oleh karena itu, dalam penelitian ini digunakan metode pemilihan fitur Genetic Algorithm agar bisa meningkatkan akurasi Naïve Bayes. Penelitian ini menghasilkan klasifikasi teks dalam bentuk positif atau negatif dari review produk kecantikan. Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation. Pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi Naïve Bayes dari 65.50% menjadi 83%.

Kata Kunci— Algoritma, Naive Bayes, Review, Opinion Mining

Unduhan

Data unduhan belum tersedia.

Diterbitkan

2018-01-31