71130097, Ruddy Cahyanto (2020) IMPLEMENTASI MODIFIED K-MEANS CLUSTERING PADA PENGELOMPOKAN DATA KOMENTAR SENTIPOL. Final Year Projects (S1) thesis, Universitas Kristen Duta Wacana.
Text (Skripsi Informatika)
71130097_bab1_bab5_daftarpustaka.pdf Download (519kB) |
|
Text (Skripsi Informatika)
71130097_bab2-sd-bab4_lampiran.pdf Restricted to Registered users only Download (2MB) | Request a copy |
Abstract
Dataset sentipol merupakan dataset mengenai sentimen politik pada pemilihan presiden periode 2014-2019 yang dibangun oleh Rachmat dan Lukito (2016) yang berisikan status dan komentar pada facebook page masing-masing calon presiden. Sebelumnya, Rachmat dan Lukito (2016) telah melakukan klasifikasi pada dataset sentipol menggunakan metode Naive Bayes dan Support Vector Machine dimana keakuratan hasil klasifikasi tersebut masing-masing 83,32% dan 84,82%. Namun pada penelitian tersebut, Rachmat dan Lukito (2016) belum mencoba melakukan clustering. Oleh karena itu penulis akan mencoba melakukan clustering pada dataset sentipol menggunakan algoritma yang umum dipakai yaitu K-means. Namun, K-means memiliki kelemahan dimana hasil cluster yang dihasilkan tidak konsisten karena centroid yang dipilih secara random (Sujatha & Sona, 2013). Dari kelemahan yang ada pada metode K-means, penulis akan melakukan clustering dengan metode Modified K-means dan menggunakan algoritma modified centroid selection dengan harapan agar bisa mengatasi kelemahan tersebut (Sujatha & Sona, 2013). Hasilnya, setelah melakukan perbandingan antara metode K-means biasa dengan Modified K-means, metode Modified K-means terbukti menghasilkan hasil cluster yang lebih konsisten. Selain itu, hasil cluster dari Modified K-means juga menghasilkan nilai purity yang lebih baik dibandingkan metode K-means biasa. Pada clustering yang menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 42% sedangkan K-Means menghasilkan persentase rata-rata nilai purity sebesar sebesar 39,1%. Sementara pada clustering yang tidak menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 40,1% sedangkan persentase rata-rata nilai purity yang dihasilkan pada K-Means sebesar 37,4%.
Item Type: | Student paper (Final Year Projects (S1)) |
---|---|
Subjects: | J Ilmu Politik > Ilmu Politik (Umum) Q Ilmu Pengetahuan > Matematika > Komputer Elektronik. Ilmu Komputer |
Divisions: | Fakultas Teknologi Informasi > Prodi Informatika |
Depositing User: | ms Nunciata Sidjabat |
Date Deposited: | 27 Apr 2020 22:36 |
Last Modified: | 10 Jun 2021 01:59 |
URI: | http://katalog.ukdw.ac.id/id/eprint/2302 |
Actions (login required)
View Item |