IMPLEMENTASI ALGORITMA SINGLE LINKAGE UNTUK CLUSTERING DOKUMEN TEKS

22064075, Vika Serlita (2012) IMPLEMENTASI ALGORITMA SINGLE LINKAGE UNTUK CLUSTERING DOKUMEN TEKS. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
22064075_bab1_bab5_daftarpustaka.pdf

Download (2MB)
[img] Text (Skripsi Informatika)
22064075_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (5MB) | Request a copy

Abstract

Kemudahan dalam mendapatkan informasi di jaman sekarang membuat sering sekali terjadi penimbunan di tempat penyimpanan. Informasi yang penting maupun tidak penting bercampur menjadi satu sehingga sulit untuk membedakan mana informasi yang benar-benar dibutuhkan dan tidak. Sangat penting adanya proses pengelompokan terhadap informasi-informasi tersebut. Pengelompokan ini dapat dilakukan secara digital (otomatis) maupun manual. Secara manual, tidak dapat berlangsung optimal, disebabkan kesulitan dalam mengelompokkan ataupun penentuan topik untuk tiap dokumen yang bisa sampai ribuan jumlahnya. Yang dapat memakan banyak waktu, tenaga, biaya dan tidak menutup kemungkinan terjadinya kesalahan dalam proses tersebut. Sehingga, diperlukan otomatisasi untuk mengelompokkan dokumen teks yang mempermudah user dalam mencari dan menganalisa suatu informasi. Clustering Hierarki menggunakan algoritma Single Linkage merupakan solusi untuk membantu proses pengelompokkan. Proses pengelompokkan dimulai dari pembersihan isi dokumen. Dilanjutkan dengan mencari nilai kemiripan antar tiap dua dokumen. Dua dokumen dengan nilai kemiripan yang paling tinggi akan bergabung membentuk satu cluster baru. Proses penggabungan ini berlangsung sampai terbentuk satu cluster tunggal yang berisi semua dokumen. Proses penggabungan yang terjadi di tiap level menghasilkan bentuk hierarkis dari cluster. Untuk mengukur nilai penyebaran data-data dari hasil clustering, dihitung nilai variance within cluster(Vw), nilai variance between cluster(Vb), dan nilai variance(V). Sistem menghasilkan nilai Vw sebanyak 57.14% lebih kecil dari proses manual, nilai Vb sebanyak 85.71% lebih besar dari proses manual, dan nilai V sebanyak 57.14% lebih kecil dari proses manual. Proses manual menghasilkan nilai Vw sebanyak 28.57% lebih kecil dari sistem, nilai Vb sebanyak 14.29% lebih besar dari sistem, dan nilai V sebanyak 14.29% lebih kecil dari sistem. Antara sistem dan proses manual juga menghasilkan nilai yang sama untuk Vw sebanyak 14.29% , nilai V sebanyak 28.57%, dan tidak pernah bernilai sama untuk Vb. Dari hasil perhitungan nilai varian terlihat sistem menghasilkan nilai variance yang lebih kecil dari proses manual, yang berarti hasil clustering sistem lebih ideal/berkualitas lebih baik dari hasil clustering proses manual.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Clustering Hierarki, algoritma Single Linkage, variance within cluster(Vw), nvariance between cluster (Vb), nilai variance(V)
Subjects: Q Ilmu Pengetahuan > QA Matematika > QA75 Komputer Elektronik. Ilmu Komputer
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Ms Lea Destiany
Date Deposited: 18 Jun 2021 02:18
Last Modified: 18 Jun 2021 02:18
URI: http://katalog.ukdw.ac.id/id/eprint/4337

Actions (login required)

View Item View Item