PENGELOMPOKAN DOKUMEN TEKS DENGAN MENGGUNAKAN METODE FUZZY C-MEANS

22074217, Yessika Naftali Budiono (2011) PENGELOMPOKAN DOKUMEN TEKS DENGAN MENGGUNAKAN METODE FUZZY C-MEANS. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
22074217_bab1_bab5_daftarpustaka.pdf

Download (425kB)
[img] Text (Skripsi Informatika)
22074217_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Pada zaman perkembangan teknologi saat ini, semakin banyak pula data- data penting yang tersimpan dalam bentuk digital pada suatu sistem penyimpanan tertentu. Sebagian besar metode clustering ditujukan kepada data terstruktur, yaitu data yang berupa angka dan mempunyai nilai yang jelas. Sedangkan dokumen berupa teks termasuk data tidak terstruktur yang sulit dikelompokkan langsung secara manual berdasarkan kemiripan isi dokumen. Maka dari itu, penulis ingin melakukan penelitian dalam pengelompokan dokumen. Pada kasus ini, penulis melakukan sebuah penelitian pengelompokan dokumen teks dengan menggunakan metode Fuzzy C-Means. Penelitian dilakukan terhadap dokumen sederhana dan dokumen kompleks. Dokumen sederhana dibuat oleh penulis secara manual yang berisi sebuah kalimat singkat dengan kata-kata yang sederhana. Sedangkan dokumen kompleks diambil dari situs berita dengan cara copy-paste isi berita kemudian disimpan dalam bentuk *.txt sebanyak 100 dokumen. Kemudian penulis memasukkan dokumen tersebut satu persatu ke dalam sistem diikuti dengan proses tokenisasi. Setelah tokenisasi, sistem melakukan pembobotan tf-idf, feature selection, kemudian menciptakan dokumen vektor dan menghitung magnitude tiap dokumen. Dari nilai magnitude tersebut baru dilakukan pengelompokan dengan menggunakan metode Fuzzy C-Means. Setelah didapat hasil pengelompokan dokumen, ternyata metode Fuzzy CMeans cukup bagus dalam melakukan pengelompokan dokumen sederhana dengan nilai purity sebesar 0,83. Namun pada dokumen yang kompleks, metode tersebut kurang mampu untuk melakukan pengelompokan dokumen dengan baik. Hal tersebut disimpulkan dari nilai purity yang rendah yaitu pada kisaran 0,3 sampai 0,4.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Clustering dokumen teks, pengelompokan dokumen teks, Fuzzy C-Means.
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Ms Hilaria Fortuna
Date Deposited: 06 Oct 2021 03:05
Last Modified: 06 Oct 2021 03:05
URI: http://katalog.ukdw.ac.id/id/eprint/5869

Actions (login required)

View Item View Item