ENERAPAN STRUKTUR TAKSONOMI WIKIPEDIA PADA METODE K-NEAREST NEIGHBOR DALAM PENGKLASIFIKASIAN ARTIKEL BLOG BERBAHASA INGGRIS

22074207, Maria Evarisma Wulandari (2011) ENERAPAN STRUKTUR TAKSONOMI WIKIPEDIA PADA METODE K-NEAREST NEIGHBOR DALAM PENGKLASIFIKASIAN ARTIKEL BLOG BERBAHASA INGGRIS. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
22074207_bab1_bab5_daftarpustaka.pdf

Download (261kB)
[img] Text (Skripsi Informatika)
22074207_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Saat ini banyak sistem klasifikasi yang diciptakan dalam rangka membantu pengguna dalam melakukan pengklasifikasian dokumen dengan menggunakan berbagai metode klasifikasi yang ada. Namun sebagian besar sistem klasifikasi tersebut hanya berbasis pada statistik semata dan sebagian besar BOW (Bag of Words) yang terbentuk hanyalah berdasarkan pada satuan kata yang sering tidak dapat mewakili dokumen. Penulis membangun sebuah sistem klasifikasi dengan menggunakan metode k-Nearest Neighbor (KNN) dan memanfaatkan struktur taksonomi Wikipedia yang menekankan pada hubungan semantik dari kata yang ada di dalam dokumen. Tujuan penelitian ini adalah untuk melihat seberapa jauh peran taksonomi Wikipedia dalam meningkatkan nilai akurasi sistem. Studi kasus yang digunakan oleh penulis adalah artikel blog berbahasa inggris yang berupa dokumen RSS dan bersumber pada www.wordpress.com. Sistem melakukan tokenisasi berdasarkan pada frase yang didapatkan dari kumpulan topik yang terdaftar pada Wikipedia, sehingga pemecahan kata pada artikel uji berdasarkan pada kumpulan frase ini. Cara tokenisasi seperti ini membantu meningkatkan akurasi sistem dalam menentukan artikel dengan tingkat kesamaan dengan artikel yang diuji. Sistem klasifikasi yang dibangun oleh penulis dapat menghasilkan tingkat akurasi yang tinggi dengan menggunakan nilai k= 6 dan seleksi fitur 50%, yaitu sebesar 98.83 %. Pemanfaatan struktur Wikipedia memberi manfaat dalam meningkatkan nilai akurasi klasifikasi artikel.

Item Type: Thesis (Bachelor)
Subjects: P Language and Literature > PE English
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Ms Nadya Agatha
Date Deposited: 23 Aug 2021 03:05
Last Modified: 23 Aug 2021 03:05
URI: http://katalog.ukdw.ac.id/id/eprint/5379

Actions (login required)

View Item View Item