PENERAPAN NEAREST NEIGHBOR CLUSTERING TERHADAP DATAWAREHOUSE TRANSAKSI PENJUALAN DENGAN PENDEKATAN PIVOTING

71120095, Yoas Hernanda (2016) PENERAPAN NEAREST NEIGHBOR CLUSTERING TERHADAP DATAWAREHOUSE TRANSAKSI PENJUALAN DENGAN PENDEKATAN PIVOTING. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71120095_bab1_bab5_daftarpustaka.pdf

Download (3MB)
[img] Text (Skripsi Informatika)
71120095_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (5MB) | Request a copy

Abstract

Nearest Neighbor Clustering merupakan salah satu metode klasterisasi dalam Data Mining. Metode ini melakukan klasterisasi secara bertahap untuk menentukan klaster data dengan melakukan perhitungan jarak data baru dengan semua data lama yang telah dipetakan pada klaster sebelumnya. Hasil perhitungan jarak data baru dengan semua data lama akan dipilih jarak dengan tingkat kemiripan paling besar. Apabila jarak tersebut memenuhi nilai threshold, titik baru akan dipetakan pada klaster yang sama sesuai data dengan jarak terdekat. Perhitungan jarak antar data pada penelitian ini menerapkan Metode Euclidean Distance dan Cosine Similarity, yang didukung Metode Normalisasi Min-Max dan Altman ZScore. Seluruh metode ini dikombinasi dan di uji menggunakan Data Uji Transaksi Bon dan Tunai Retail Fashion dan Sepatu dengan kurun waktu 3 Tahun, terhitung dari Tahun 2010 sampai Tahun 2012. Evaluasi berdasarkan penentuan nilai threshold dan kombinasi metode menghasilkan Kombinasi Metode Normalisasi Min-Max dan Metode Similarity Euclidean Distance dengan rata-rata nilai purity paling tinggi, yaitu 0.299 di atas kombinasi lain yang mencapai nilai paling tinggi tidak terpaut jauh yaitu 0.290 pada Kombinasi Metode Normalisasi ZScore dan Metode Cosine Similarity. Berdasarkan hasil evaluasi tersebut, threshold dengan nilai 0.35 dan Kombinasi Metode yang paling optimal berdasarkan data uji yang tersedia, yaitu Metode Min-Max dan Euclidean Distance dipakai pada akhir penelitian untuk meneliti perilaku belanja pelanggan pada setiap kuartal pada keseluruhan data transaksi.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Nearest Neighbor Clustering, Single Linkage, Complete Linkage, Data Mining, Implementasi Algoritma, Big Data, Data Warehouse, Euclidean Distance, Cosine Distance, Z-Score, Min-Max
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: mr Kristofer Bayu Pamungkas - Resign
Date Deposited: 28 Jun 2021 01:24
Last Modified: 28 Jun 2021 01:24
URI: http://katalog.ukdw.ac.id/id/eprint/1641

Actions (login required)

View Item View Item