eprintid: 2302 rev_number: 18 eprint_status: archive userid: 22 dir: disk0/00/00/23/02 datestamp: 2020-04-27 22:36:39 lastmod: 2021-06-10 01:59:57 status_changed: 2020-04-27 22:36:39 type: thesis metadata_visibility: show contact_email: repository@staff.ukdw.ac.id creators_name: 71130097, Ruddy Cahyanto creators_id: ruddy.c@ti.ukdw.ac.id contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_name: C., ANTONIUS RACHMAT contributors_name: Sebastian, Danny corp_creators: Universitas Kristen Duta Wacana title: IMPLEMENTASI MODIFIED K-MEANS CLUSTERING PADA PENGELOMPOKAN DATA KOMENTAR SENTIPOL ispublished: pub subjects: JA subjects: QA75 divisions: tek_informatika full_text_status: restricted abstract: Dataset sentipol merupakan dataset mengenai sentimen politik pada pemilihan presiden periode 2014-2019 yang dibangun oleh Rachmat dan Lukito (2016) yang berisikan status dan komentar pada facebook page masing-masing calon presiden. Sebelumnya, Rachmat dan Lukito (2016) telah melakukan klasifikasi pada dataset sentipol menggunakan metode Naive Bayes dan Support Vector Machine dimana keakuratan hasil klasifikasi tersebut masing-masing 83,32% dan 84,82%. Namun pada penelitian tersebut, Rachmat dan Lukito (2016) belum mencoba melakukan clustering. Oleh karena itu penulis akan mencoba melakukan clustering pada dataset sentipol menggunakan algoritma yang umum dipakai yaitu K-means. Namun, K-means memiliki kelemahan dimana hasil cluster yang dihasilkan tidak konsisten karena centroid yang dipilih secara random (Sujatha & Sona, 2013). Dari kelemahan yang ada pada metode K-means, penulis akan melakukan clustering dengan metode Modified K-means dan menggunakan algoritma modified centroid selection dengan harapan agar bisa mengatasi kelemahan tersebut (Sujatha & Sona, 2013). Hasilnya, setelah melakukan perbandingan antara metode K-means biasa dengan Modified K-means, metode Modified K-means terbukti menghasilkan hasil cluster yang lebih konsisten. Selain itu, hasil cluster dari Modified K-means juga menghasilkan nilai purity yang lebih baik dibandingkan metode K-means biasa. Pada clustering yang menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 42% sedangkan K-Means menghasilkan persentase rata-rata nilai purity sebesar sebesar 39,1%. Sementara pada clustering yang tidak menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 40,1% sedangkan persentase rata-rata nilai purity yang dihasilkan pada K-Means sebesar 37,4%. date: 2020-02-29 date_type: published pages: 103 institution: Universitas Kristen Duta Wacana department: Informatika thesis_type: skripsi thesis_name: other citation: 71130097, Ruddy Cahyanto (2020) IMPLEMENTASI MODIFIED K-MEANS CLUSTERING PADA PENGELOMPOKAN DATA KOMENTAR SENTIPOL. Bachelor thesis, Universitas Kristen Duta Wacana. document_url: https://katalog.ukdw.ac.id/2302/1/71130097_bab1_bab5_daftarpustaka.pdf document_url: https://katalog.ukdw.ac.id/2302/2/71130097_bab2-sd-bab4_lampiran.pdf