IMPLEMENTASI MODIFIED K-MEANS CLUSTERING PADA PENGELOMPOKAN DATA KOMENTAR SENTIPOL

71130097, Ruddy Cahyanto (2020) IMPLEMENTASI MODIFIED K-MEANS CLUSTERING PADA PENGELOMPOKAN DATA KOMENTAR SENTIPOL. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71130097_bab1_bab5_daftarpustaka.pdf

Download (519kB)
[img] Text (Skripsi Informatika)
71130097_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (2MB) | Request a copy

Abstract

Dataset sentipol merupakan dataset mengenai sentimen politik pada pemilihan presiden periode 2014-2019 yang dibangun oleh Rachmat dan Lukito (2016) yang berisikan status dan komentar pada facebook page masing-masing calon presiden. Sebelumnya, Rachmat dan Lukito (2016) telah melakukan klasifikasi pada dataset sentipol menggunakan metode Naive Bayes dan Support Vector Machine dimana keakuratan hasil klasifikasi tersebut masing-masing 83,32% dan 84,82%. Namun pada penelitian tersebut, Rachmat dan Lukito (2016) belum mencoba melakukan clustering. Oleh karena itu penulis akan mencoba melakukan clustering pada dataset sentipol menggunakan algoritma yang umum dipakai yaitu K-means. Namun, K-means memiliki kelemahan dimana hasil cluster yang dihasilkan tidak konsisten karena centroid yang dipilih secara random (Sujatha & Sona, 2013). Dari kelemahan yang ada pada metode K-means, penulis akan melakukan clustering dengan metode Modified K-means dan menggunakan algoritma modified centroid selection dengan harapan agar bisa mengatasi kelemahan tersebut (Sujatha & Sona, 2013). Hasilnya, setelah melakukan perbandingan antara metode K-means biasa dengan Modified K-means, metode Modified K-means terbukti menghasilkan hasil cluster yang lebih konsisten. Selain itu, hasil cluster dari Modified K-means juga menghasilkan nilai purity yang lebih baik dibandingkan metode K-means biasa. Pada clustering yang menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 42% sedangkan K-Means menghasilkan persentase rata-rata nilai purity sebesar sebesar 39,1%. Sementara pada clustering yang tidak menggunakan stemming, Modified K-Means mampu menghasilkan persentase rata-rata nilai purity sebesar 40,1% sedangkan persentase rata-rata nilai purity yang dihasilkan pada K-Means sebesar 37,4%.

Item Type: Thesis (Bachelor)
Subjects: J Political Science > JA Political science (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: ms Nunciata Sidjabat-Resign
Date Deposited: 27 Apr 2020 22:36
Last Modified: 10 Jun 2021 01:59
URI: http://katalog.ukdw.ac.id/id/eprint/2302

Actions (login required)

View Item View Item