EVALUASI WORDNET BAHASA PADA INFORMATION RETRIEVAL SYSTEM

71110022, LUCIA HYANING PERGIWATI PUTRI KINASIH (2016) EVALUASI WORDNET BAHASA PADA INFORMATION RETRIEVAL SYSTEM. Bachelor thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71110022_bab1_bab5_daftarpustaka.pdf

Download (795kB)
[img] Text (Skripsi Informatika)
71110022_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (2MB) | Request a copy

Abstract

Semantic similarity adalah sebuah masalah pada hubungan semantik. Hubungan semantik merupakan pendekatan untuk mengetahui bagaimana hubungan dua konsep dalam penggunaan dan relasinya. Latent Semantic Indexing (LSI) merupakan sebuah metode pendekatan dimensional reduction yang menghasilkan dokumen – dokumen yang relevan, sedangkan Wordnet menyediakan kumpulan data yang menyimpan informasi relasi semantik antar synset (synonim set). Pada penelitian ini, penulis mencoba untuk meneliti tingkat performa pencarian dengan menggunakan ekspansi Wordnet Bahasa dibandingkan dengan pencarian dengan menggunakan metode LSI. Setiap jenis data akan dihitung jarak kemiripannya dengan kumpulan query yang diberikan menggunakan cosine similarity. Setiap hasil pencarian akan dievaluasi menggunakan nilai recall, precision, dan f-measure sebagai satuan ukur evaluasinya. Pencarian dengan menggunakan LSI mampu mengambil 99 – 100% data relevan, tetapi tidak dapat menghasilkan performa sistem yang baik terlihat dari rata – rata nilai f-measure sebesar 0.1174. Hal ini disebabkan oleh rendahnya nilai precision karena banyaknya data yang tidak relevan yang juga ikut terambil saat pencarian. Ekspansi Wordnet Bahasa pada data kompas mampu mengambil rata – rata 96% data relevan dan pada data ICL mampu mengambil rata – rata 49% data relevan. Performa sistem saat proses retrieval dengan melakukan ekspansi Wordnet Bahasa untuk kedua jenis data lebih tinggi dibandingkan dengan proses retrieval menggunakan LSI dengan rata – rata nilai f-measure sebesar 0.2732 untuk data kompas dan 0.1320 untuk data ICL.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: cosine similarity, f-measure, latent semantic indexing, precision, recall, Wordnet Bahasa
Subjects: P Language and Literature > PI Oriental languages and literatures
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: ms Dominggas Yembise - Keluar
Date Deposited: 24 Jun 2020 03:06
Last Modified: 24 Jun 2020 03:06
URI: http://katalog.ukdw.ac.id/id/eprint/2208

Actions (login required)

View Item View Item