PENGEMBANGAN SISTEM INFORMATION RETRIEVAL UNTUK BAHASA INDONESIA BERBASIS WEB MENGGUNAKAN VECTOR SPACE MODEL

71130027, Danny Joe Dozan (2019) PENGEMBANGAN SISTEM INFORMATION RETRIEVAL UNTUK BAHASA INDONESIA BERBASIS WEB MENGGUNAKAN VECTOR SPACE MODEL. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71130027_bab1_bab5_daftarpustaka.pdf

Download (1MB)
[img] Text (Skripsi Informatika)
71130027_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (2MB) | Request a copy

Abstract

Sistem temu kembali adalah sistem untuk memperoleh informasi dari kumpulan sumber informsi yang relevan dengan keinginan pengguna. Salah satu pengembang mesin pencarian yang bernama Solr menyediakan fitur untuk memberi term expansion berupa synonym. Fitur ini digunakan pada penelitian ini untuk memasukkan tesaurus. Tesaurus merupakan hubungan antar kata yang dikelompokkan menjadi satu kelompok. Tesaurus yang digunakan pada penelitian ini menggunakan hasil penelitian dari Himawan (2015) yang berbentuk file RDF. Pada penelitian ini ditambahkan fitur kata majemuk untuk menggabungkan dua kata menjadi satu supaya pada saat query matching tidak terpisah. Untuk melihat tingkat keefektifitas saat me-retrieve dokumen, penulis membandingkan sistem jika ditambah stemming dengan tidak ditambah stemming. Sistem yang dibangun pada penelitian ini dibentuk menjadi sebuah search engine yang berbasis javascript. Sistem yang dibangun diuji F-Measure untuk 20 topik utama yang telah ditentukan dan menghasilkan nilai 0.3728 untuk sistem dengan stemming dan 0.3716 untuk sistem tanpa stemming. Setelah itu, sistem yang dibangun diuji kepada responden dengan 30 topik yang berbeda dan dihitung Mean Average Precision-nya yang bernilai 0.6225 untuk sistem dengan stemming dan 0.6279 untuk sistem tanpa stemming. Dapat disimpulkan bahwa sistem yang dibangun dengan ad-hoc evaluation lebih baik sistem dengan stemming, namun jika dicoba langsung kepada responden lebih baik sistem tanpa stemming.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Solr, SKOS, Thesaurus, Search Engine, Information Retrieval
Subjects: P Language and Literature > PL Languages and literatures of Eastern Asia, Africa, Oceania
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Mr Brayen Samuel Paendong
Date Deposited: 05 Mar 2020 01:57
Last Modified: 23 Jun 2021 02:02
URI: http://katalog.ukdw.ac.id/id/eprint/443

Actions (login required)

View Item View Item