Penerapan Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kognitif Soal pada Taksonomi Bloom
DOI:
https://doi.org/10.51998/jsi.v6i1.224Abstrak
Abstract— Bloom's Taxonomy is a classification system that is used to define and distinguish the level of cognition (thinking, learning, and understanding) human diverse. The initial purpose in making taxonomy is focusing on three main domains of learning, which is cognitive, affective, and psychomotor. Nowadays, academics identify cognitive levels of Bloom of a question manually. However, only few academics that can be identify the cognitive level correctly, so most of them made a mistake to categorize questions. K-Nearest Neighbor (KNN) is a simple but effective method for categorization cognitive level questions on the Bloom's Taxonomy, however KNN has high dimention of text vector. In order to resolve these problems, the Information Gain (IG) method is needed to reduce dimention of text vector. Several experiments were conducted to obtain optimal architecture and produce an accurate classification. The results of 10 experiments on the Question Bank dataset with KNN obtained the biggest accuracy is 59,87% and the biggest kappa is 0,496. Then on KNN + IG obtained the biggest accuracy is 66,18% and the biggest kappa is 0,574 It can be concluded that the classification level cognitive questions on Bloom's taxonomy using KNN + IG method is more accurate than the KNN method only.
Intisari— Taksonomi Bloom merupakan sistem klasifikasi yang digunakan untuk mendefinisikan dan membedakan tingkat kognisi (berpikir, belajar, dan memahami) manusia yang berbeda-beda. Tujuan awal dalam pembuatan taksonomi adalah memfokuskan pada tiga domain utama dari pembelajaran, yaitu kognitif, afektif, dan psikomotorik. Saat ini, kalangan akademisi mengidentifikasi tingkat kognitif Bloom sebuah pertanyaan secara manual. Namun, hanya sedikit akademisi yang dapat mengidentifikasi tingkat kognitif dengan benar, sehingga sebagian besar melakukan kesalahan mengkategorisasikan pertanyaan. K-Nearest Neighbor (KNN) merupakan metode sederhana namun efektif untuk kategorisasi tingkat kognitif soal pada taksonomi Bloom, namun KNN memiliki dimensi vektor yang besar. Untuk menyelesaikan masalah tersebut diperlukan metode Information Gain (IG) untuk mengurangi dimensi vektor teks. Beberapa eksperimen dilakukan untuk mendapatkan arsitektur yang optimal dan menghasilkan klasifikasi yang akurat. Hasil dari 10 eksperimen pada dataset Question Bank dengan KNN didapatkan akurasi terbesar adalah 59,97% dan kappa terbesar adalah 0,496. Kemudian pada KNN+IG didapatkan akurasi terbesar adalah 66,18% dan kappa terbesar adalah 0,574. Maka dapat disimpulkan klasifikasi tingkat kognitif soal pada taksonomi Bloom dengan menggunakan metode KNN+IG lebih akurat dibanding dengan metode KNN saja.
Kata Kunci — Klasifikasi, Taksonomi Bloom, K-Nearest Neighboor, Information Gain