IMPLEMENTASI ALGORITMA OKAPI BM25 DAN KMEANS UNTUK MENCARI RELEVANSI ARTIKEL PADA BEBERAPA SITUS BERITA

22074222, Danny Sebastian (2011) IMPLEMENTASI ALGORITMA OKAPI BM25 DAN KMEANS UNTUK MENCARI RELEVANSI ARTIKEL PADA BEBERAPA SITUS BERITA. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
22074222_bab1_bab5_daftarpustaka.pdf

Download (736kB)
[img] Text (Skripsi Informatika)
22074222_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Media informasi semakin berkembang pesat. Banyak media elektronik yang dibangun untuk meningkatkan penyebaran informasi. Seiring dengan perkembangan teknologi, tuntutan masyarakat akan kebutuhan media informasi yang semakin mudah diakses pun semakin meningkat. Media informasi yang mulai dipilih sebagai alternative penyampaian informasi adalah website. Seiring dengan berkembangnya website, semakin UKDW banyak pula website bertemakan berita yang bermunculan. Dengan semakin banyaknya website berita, website-website berita harus bersaing untuk meningkatkan jumlah pengunjung dengan cara meningkatkan jumlah artikel berita yang mereka miliki. Oleh karena itu, dibutuhkan cara pencarian artikel guna memudahkan pengguna mencari artikel. Untuk mempermudah hal tersebut penulis membangun sebuah sistem yang dapat mengumpulkan artikel dari beberapa situs berita. Penulis menggunakan 2 algoritma yang efektif untuk memudahkan pencarian artikel, yaitu algoritma Okapi BM25 dan K-Means. Kombinasi kedua algoritma tersebut bertujuan untuk mendapatkan hasil pencarian yang lebih efektif. Dalam penelitian ini, penulis melakukan pembandingan antara pencarian menggunakan Okapi BM25 tanpa menggunakan clustering dan pencarian menggunakan Okapi BM25 dengan menggunakan clustering. Hasil yang didapat dari penelitian ini adalah kombinasi kedua algoritma tidak memberikan manfaat yang signifikan terhadap performa system ketika dibandingkan dengan pencarian tanpa metode clustering. Pada penelitian ini pemrosesan tanpa clustering memiliki nilai rata-rata precision dan recall sebesar 72.73% dan 97.38%. sedangkan pemrosesan dengan menggunakan clustering memiliki rata-rata precision dan recall sebesar 72.76% dan 80.10%.

Item Type: Thesis (Bachelor)
Subjects: Q Science > QA Mathematics
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Z Bibliography. Library Science. Information Resources > ZA Information resources
Z Bibliography. Library Science. Information Resources > ZA Information resources > ZA4050 Electronic information resources
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Ms Hilaria Fortuna
Date Deposited: 06 Oct 2021 03:09
Last Modified: 06 Oct 2021 03:09
URI: http://katalog.ukdw.ac.id/id/eprint/5870

Actions (login required)

View Item View Item