eprintid: 4605 rev_number: 12 eprint_status: archive userid: 52 dir: disk0/00/00/46/05 datestamp: 2021-08-06 03:10:19 lastmod: 2021-08-06 03:10:19 status_changed: 2021-08-06 03:10:19 type: thesis metadata_visibility: show contact_email: repository@staff.ukdw.ac.id creators_name: 71130080, Hendrawan creators_id: hendrawan@ti.ukdw.ac.id contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_name: Chrismanto, Antonius Rachmat contributors_name: Lukito, Yuan corp_creators: Universitas Kristen Duta Wacana title: ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN) ispublished: pub subjects: QA75 subjects: QA76 divisions: tek_informatika full_text_status: restricted keywords: [KNN, neighbor weighted K-nearest neighbor (NWKNN), text mining, sentiment analysis] abstract: Pada umumnya pengklasifikasian teks mengasumsikan bahwa data latih yang digunakan terdistribusikan secara sama rata pada setiap kategorinya. Padahal kenyataannya sering sekali kumpulan data yang digunakan untuk latih tidak seimbang sehingga memunculkan data yang masuk ke dalam kategori mayoritas dan minoritas. Seperti pada pengujian ini menggunakan dataset sentipol pemilihan presiden Indonesia pada tahun 2014 memiliki dataset yang tidak seimbang. Dengan tidak seimbangnya data latih ini menyebabkan klasifikasi pada KNN menjadi tidak akurat dan hasil analisisnya selalu cenderung ke kategori yang mayoritas. Dengan keadaan inilah NWKNN muncul untuk mengurangi kesalahan dalam data yang tidak seimbang. Pada penelitian ini akan dilakukan proses preprocessing pada biasanya seperti case folding, cleansing, tokenizing, sinonim kamus, stop word removal dan stemming. Lalu akan dilakukan pembobotan menggunakan TF-IDF dan cosine similarity untuk mencari kemiripan dokumen. Kemudian akan dilakukan klasifikasi menggunakan NWKNN. Dari hasil tersebut akan dibandingkan hasil dari KNN biasa dengan NWKNN. Penelitian ini membuktikan bahwa NWKNN memang cocok digunakan dalam pembelajaran data latih yang tidak seimbang. Penelitian ini menghasilkan kenaikan akurasi sebesar 6.25% dari KNN biasa dengan nilai akurasi dari 58.75% menjadi 65%. Penelitian lainnya dengan menambahkan kamus sinonim pada proses analisis NWKNN sehingga dapat meningkatkan akurasi sebesar 6.25% dengan nilai akurasi dari 50% menjadi 56.25%. Dalam penelitian ini juga penggunaan kamus sinonim yang dibuat penulis dapat meningkatkan akurasi dari KNN tanpa kamus dengan NWKNN menggunakan kamus sebesar 7.5% dari 66.25% menjadi 73.75%. date: 2017-11 date_type: published pages: 66 institution: Universitas Kristen Duta Wacana department: Informatika thesis_type: skripsi thesis_name: other citation: 71130080, Hendrawan (2017) ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN). Bachelor thesis, Universitas Kristen Duta Wacana. document_url: https://katalog.ukdw.ac.id/4605/1/71130080_bab1_bab5_daftarpustaka.pdf document_url: https://katalog.ukdw.ac.id/4605/2/71130080_bab2-sd-bab4_lampiran.pdf