eprintid: 1738 rev_number: 14 eprint_status: archive userid: 37 dir: disk0/00/00/17/38 datestamp: 2020-11-03 07:56:57 lastmod: 2021-06-09 02:30:38 status_changed: 2021-06-09 02:30:38 type: thesis metadata_visibility: show contact_email: repository@staff.ukdw.ac.id creators_name: 71130066, Andro Ardiyanto creators_id: androardiyanto@gmail.com contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_name: Lukito, Yuan contributors_name: Chrismanto, Antonius Rachmat corp_creators: Universitas Kristen Duta Wacana title: KLASIFIKASI KOMENTAR PADA DATASET PEMILU PRESIDEN INDONESIA 2014 DENGAN METODE IMPROVED K-NEAREST NEIGHBOR ispublished: pub subjects: QA75 divisions: tek_informatika full_text_status: restricted keywords: text mining, improved k-nn, knn, sentimen analyst abstract: Perbedaan porsi data latih dari setiap kategori dapat mempengaruhi hasil klasifikasi untuk lebih condong ke arah porsi data latih yang paling besar. Pada algoritma k-Nearest Neighbor, nilai k berpengaruh dalam menentukan proses klasifikasi dari suatu data uji. Proses klasifikasinya juga tergantung porsi data terbanyak dari tetangga yang diambil, kemunculan paling banyak pada jumlah tetangga terdekatnya. Improved KNN muncul untuk mengatasi hal tersebut. Dalam hal ini dataset yang dipakai memiliki jumlah total 2796 data (2406 data positif dan 390 data negatif). Pertama-tama data uji akan melalui proses preprocessing yang terdiri dari (convert emoticon, cleansing, casefolding, tokenizing, filtering, stemming). Data tersebut akan diberi bobot sesuai dengan TF-IDF lalu akan dilanjutkan pada proses cos-similiarity. Pada proses tersebut akan terjadi pemilihan jumlah tetangga terbesar sesuai nilai k, lalu proses improvement KNN dijalankan dan data uji tersebut diklasifikasikan. Penelitian ini menghasilkan bahwa Improved KNN sukses dalam menaikkan akurasi pengklasifikasian. Penggunaan feature selection meningkatkan akurasi pada data latih dengan perbedaan 1800 data sebanyak 1,01%, dari 76,52% menjadi 77,53%. Peningkatan akurasi terbesar sebesar 1,48% terjadi pada skenario dengan ketimpangan data latih 900 buah, sedangkan pada data seimbang dan perbedaan data latih 300 buah, tidak terjadi perubahan akurasi jika dibandingkan dengan Default KNN. date: 2017-07 date_type: published pages: 75 institution: Universitas Kristen Duta Wacana department: Informatika thesis_type: skripsi thesis_name: other citation: 71130066, Andro Ardiyanto (2017) KLASIFIKASI KOMENTAR PADA DATASET PEMILU PRESIDEN INDONESIA 2014 DENGAN METODE IMPROVED K-NEAREST NEIGHBOR. Final Year Projects (S1) thesis, Universitas Kristen Duta Wacana. document_url: https://katalog.ukdw.ac.id/1738/1/71130066_bab1_bab5_daftarpustaka.pdf document_url: https://katalog.ukdw.ac.id/1738/2/71130066_bab2-sd-bab4_lampiran.pdf