IMPLEMENTASI NAMED ENTITY RECOGNITION DALAM SISTEM OTOMASI PEMBERIAN INDEKS DOKUMEN PADA APACHE SOLR

Eusebia Fernanda Siahaan (2023) IMPLEMENTASI NAMED ENTITY RECOGNITION DALAM SISTEM OTOMASI PEMBERIAN INDEKS DOKUMEN PADA APACHE SOLR. Final Year Projects (S1) thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71180323_bab1_bab5_daftarpustaka.pdf

Download (2MB)
[img] Text (Skripsi Informatika)
71180323_bab2-sd-bab4_lampiran.pdf
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Fakultas Teknologi Informasi (FTI) Universitas Kristen Duta Wacana (UKDW) memiliki suatu repositori untuk menyimpan seluruh dokumen resmi yang telah diterbitkan. Repositori tersebut menggunakan Apache SOLR (Search on Lucene, Rescaled) atau yang biasa disebut SOLR sebagai mesin pencari. SOLR mengalami kesulitan dalam proses pencarian dokumen. Hal ini dikarenakan sebagian besar dokumen yang tersimpan merupakan data tidak terstruktur dan belum memiliki indeks. SOLR akan kesulitan untuk melakukan pencarian berdasarkan isi dari dokumen tersebut, seperti contoh mencari berdasarkan judul atau tanggal pengesahan dokumen dari dokumen tersebut. SOLR sendiri tidak memiliki fitur untuk menentukan indeks secara otomatis dalam dokumen tersebut. Pada kasus ini, Named Entity Recognition (NER) dapat membantu pada proses pemberian indeks secara otomatis terhadap dokumen. NER membantu menentukan entitas dari suatu kata atau frasa dimana kata yang sudah mendapat entitas dapat dijadikan sebagai indeks untuk mesin pencari SOLR. Peneliti menggunakan dokumen resmi yang dikeluarkan dan tersimpan pada repositori FTI UKDW. Isi dari dokumen tersebut akan diberi entitas dengan mengimplementasi NER menggunakan metode Conditional Random Fields (CRF). Entitas yang terbentuk akan diubah menjadi indeks dan tersimpan dalam format JSON. Indeks dengan format JSON tersebut akan disimpan pada mesin pencari SOLR yang akan digunakan SOLR dalam proses pencarian kembali. Penelitian ini, menghasilkan sebuah sistem otomatisasi pemberian indeks dokumen dengan implementasi NER. Sistem tersebut dapat memberikan indeks dokumen dengan mengandalkan entitas yang didapati dari pengujian dengan CRF. Indeks yang didapat dapat digunakan oleh repositori FTI UKDW. Indeks yang telah terbentuk akan dipakai oleh SOLR untuk proses pencarian kembali.

Item Type: Student paper (Final Year Projects (S1))
Uncontrolled Keywords: Named Entity Recognition, Conditional Random Fields, Apache SOLR
Subjects: T Teknologi > Teknologi (Umum)
A Karya Umum
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Admin Repository
Date Deposited: 30 May 2024 04:13
Last Modified: 28 Oct 2024 06:24
URI: http://katalog.ukdw.ac.id/id/eprint/8591

Actions (login required)

View Item View Item