KLASIFIKASI SENTIMEN TERHADAP DATASET KOMENTAR PEMILU PRESIDEN 2014 PADA FACEBOOK MENGGUNAKAN SUPPORT VECTOR MACHINE

71120146, Jayadi Kurniawan (2017) KLASIFIKASI SENTIMEN TERHADAP DATASET KOMENTAR PEMILU PRESIDEN 2014 PADA FACEBOOK MENGGUNAKAN SUPPORT VECTOR MACHINE. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71120146_bab1_bab5_daftarpustaka.pdf

Download (1MB)
[img] Text (Skripsi Informatika)
71120146_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (2MB) | Request a copy

Abstract

Media sosial adalah sarana komunikasi yang sangat populer saat ini jika dilihat dari jumlah pemakainya. Salah satu media sosial yang banyak digunakan yaitu Facebook dengan berbagai tujuan penggunaan misalnya sebagai tempat diskusi, komunitas pecinta olahraga tertentu, online shop, bahkan dalam bidang politik digunakan dimanfaatkan untuk mendapatkan dukungan dari para publik. Tujuan penelitian ini adalah untuk menghasilkan suatu sistem klasifikasi sentimen berbasis web. Dataset yang digunakan adalah komentar status Facebook pemilihan umum presiden Indonesia tahun 2014. Metode Support Vector Machine (SVM) digunakan untuk proses klasifikasi komentar positif atau negatif. Tahap preprocessing yang dilkaukan adalah case folding, stemming, stopwords removal dan tokenisasi. Data komentar kebanyakan mengandung special character, angka dan emoticon. Pada penelitian ini emoticon dikonversi ke bentuk teks sesuai dengan makna masing-masing. Pembobotan dilakukan menggunakan Term Frequency Document Inverse Frequency (TF IDF). Metode lain yang diterapakan yaitu feature selection untuk menentukan nilai term yang akan digunakan dengan tujuan dapat menghasilkan nilai akurasi yang baik. Pengujian menggunakan tiga jenis dataset dengan komposisi berbeda yaitu komentar positif dan negatif tidak sama (870 dan 130), komentar positif dan negatif masing – masing berjumlah 130, dan menggunakan data latih dengan 2024 komentar positif serta 313 komentar negatif. Evaluasi sistem dilakukan menggunakan confusion matrix untuk mengukur akurasi sistem dalam melakukan klasifikasi. Rata–rata akurasi menggunakan kernel linear terhadap dataset uji yaitu 73,84%, 50,37% dan 74,99%. Sedangkan rata-rata akurasi menggunakan kernel RBF adalah 76,53%, 51,83% dan 80,81%.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Klasifikasi Sentimen, Text Mining, Support Vector Machine, Text Preprocessing, Confusion Matrix, TF IDF, Feature Selection
Subjects: Q Ilmu Pengetahuan > QA Matematika > QA75 Komputer Elektronik. Ilmu Komputer
Q Ilmu Pengetahuan > QA Matematika > QA76 Perangkat Lunak (Software) Komputer
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: ms maria sema
Date Deposited: 02 Jun 2021 08:04
Last Modified: 02 Jun 2021 08:04
URI: http://katalog.ukdw.ac.id/id/eprint/1692

Actions (login required)

View Item View Item