relation: https://katalog.ukdw.ac.id/4605/ title: ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN) creator: 71130080, Hendrawan subject: QA75 Komputer Elektronik. Ilmu Komputer subject: QA76 Perangkat Lunak (Software) Komputer description: Pada umumnya pengklasifikasian teks mengasumsikan bahwa data latih yang digunakan terdistribusikan secara sama rata pada setiap kategorinya. Padahal kenyataannya sering sekali kumpulan data yang digunakan untuk latih tidak seimbang sehingga memunculkan data yang masuk ke dalam kategori mayoritas dan minoritas. Seperti pada pengujian ini menggunakan dataset sentipol pemilihan presiden Indonesia pada tahun 2014 memiliki dataset yang tidak seimbang. Dengan tidak seimbangnya data latih ini menyebabkan klasifikasi pada KNN menjadi tidak akurat dan hasil analisisnya selalu cenderung ke kategori yang mayoritas. Dengan keadaan inilah NWKNN muncul untuk mengurangi kesalahan dalam data yang tidak seimbang. Pada penelitian ini akan dilakukan proses preprocessing pada biasanya seperti case folding, cleansing, tokenizing, sinonim kamus, stop word removal dan stemming. Lalu akan dilakukan pembobotan menggunakan TF-IDF dan cosine similarity untuk mencari kemiripan dokumen. Kemudian akan dilakukan klasifikasi menggunakan NWKNN. Dari hasil tersebut akan dibandingkan hasil dari KNN biasa dengan NWKNN. Penelitian ini membuktikan bahwa NWKNN memang cocok digunakan dalam pembelajaran data latih yang tidak seimbang. Penelitian ini menghasilkan kenaikan akurasi sebesar 6.25% dari KNN biasa dengan nilai akurasi dari 58.75% menjadi 65%. Penelitian lainnya dengan menambahkan kamus sinonim pada proses analisis NWKNN sehingga dapat meningkatkan akurasi sebesar 6.25% dengan nilai akurasi dari 50% menjadi 56.25%. Dalam penelitian ini juga penggunaan kamus sinonim yang dibuat penulis dapat meningkatkan akurasi dari KNN tanpa kamus dengan NWKNN menggunakan kamus sebesar 7.5% dari 66.25% menjadi 73.75%. date: 2017-11 type: Thesis type: NonPeerReviewed format: text language: id identifier: https://katalog.ukdw.ac.id/4605/1/71130080_bab1_bab5_daftarpustaka.pdf format: text language: id identifier: https://katalog.ukdw.ac.id/4605/2/71130080_bab2-sd-bab4_lampiran.pdf identifier: 71130080, Hendrawan (2017) ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN). Bachelor thesis, Universitas Kristen Duta Wacana.