eprintid: 4605
rev_number: 12
eprint_status: archive
userid: 52
dir: disk0/00/00/46/05
datestamp: 2021-08-06 03:10:19
lastmod: 2021-08-06 03:10:19
status_changed: 2021-08-06 03:10:19
type: thesis
metadata_visibility: show
contact_email: repository@staff.ukdw.ac.id
creators_name: 71130080, Hendrawan
creators_id: hendrawan@ti.ukdw.ac.id
contributors_type: http://www.loc.gov/loc.terms/relators/THS
contributors_type: http://www.loc.gov/loc.terms/relators/THS
contributors_name: Chrismanto, Antonius Rachmat
contributors_name: Lukito, Yuan
corp_creators: Universitas Kristen Duta Wacana
title: ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN)
ispublished: pub
subjects: QA75
subjects: QA76
divisions: tek_informatika
full_text_status: restricted
keywords: [KNN, neighbor weighted K-nearest neighbor (NWKNN), text mining, sentiment analysis]
abstract: Pada umumnya pengklasifikasian teks mengasumsikan bahwa data latih yang digunakan terdistribusikan secara sama rata pada setiap kategorinya. Padahal kenyataannya sering sekali kumpulan data yang digunakan untuk latih tidak seimbang sehingga memunculkan data yang masuk ke dalam kategori mayoritas dan minoritas. Seperti pada pengujian ini menggunakan dataset sentipol pemilihan presiden Indonesia pada tahun 2014 memiliki dataset yang tidak seimbang. Dengan tidak seimbangnya data latih ini menyebabkan klasifikasi pada KNN menjadi tidak akurat dan hasil analisisnya selalu cenderung ke kategori yang mayoritas. Dengan keadaan inilah NWKNN muncul untuk mengurangi kesalahan dalam data yang tidak seimbang. Pada penelitian ini akan dilakukan proses preprocessing pada biasanya seperti case folding, cleansing, tokenizing, sinonim kamus, stop word removal dan stemming. Lalu akan dilakukan pembobotan menggunakan TF-IDF dan cosine similarity untuk mencari kemiripan dokumen. Kemudian akan dilakukan klasifikasi menggunakan NWKNN. Dari hasil tersebut akan dibandingkan hasil dari KNN biasa dengan NWKNN. Penelitian ini membuktikan bahwa NWKNN memang cocok digunakan dalam pembelajaran data latih yang tidak seimbang. Penelitian ini menghasilkan kenaikan akurasi sebesar 6.25% dari KNN biasa dengan nilai akurasi dari 58.75% menjadi 65%. Penelitian lainnya dengan menambahkan kamus sinonim pada proses analisis NWKNN sehingga dapat meningkatkan akurasi sebesar 6.25% dengan nilai akurasi dari 50% menjadi 56.25%. Dalam penelitian ini juga penggunaan kamus sinonim yang dibuat penulis dapat meningkatkan akurasi dari KNN tanpa kamus dengan NWKNN menggunakan kamus sebesar 7.5% dari 66.25% menjadi 73.75%.
date: 2017-11
date_type: published
pages: 66
institution: Universitas Kristen Duta Wacana
department: Informatika
thesis_type: skripsi
thesis_name: other
citation:   71130080, Hendrawan  (2017) ANALISIS SENTIMEN PADA DATASET SENTIPOL MENGGUNAKAN METODE NEIGHBOR WEIGHTED K-NEAREST NEIGHBOR (NWKNN).  Bachelor thesis, Universitas Kristen Duta Wacana.   
document_url: https://katalog.ukdw.ac.id/4605/1/71130080_bab1_bab5_daftarpustaka.pdf
document_url: https://katalog.ukdw.ac.id/4605/2/71130080_bab2-sd-bab4_lampiran.pdf