eprintid: 382
rev_number: 19
eprint_status: archive
userid: 34
dir: disk0/00/00/03/82
datestamp: 2020-02-19 02:51:56
lastmod: 2021-06-23 02:16:25
status_changed: 2020-02-19 02:51:56
type: thesis
metadata_visibility: show
contact_email: repository@staff.ukdw.ac.id
creators_name: 71140005, Fidelia Vera Sentosa
creators_id: fideliavera@ti.ukdw.ac.id
contributors_type: http://www.loc.gov/loc.terms/relators/THS
contributors_type: http://www.loc.gov/loc.terms/relators/THS
contributors_name: Krisnawati, Lucia Dwi
contributors_name: Mahastama, Aditya Wikan
corp_creators: Universitas Kristen Duta Wacana
title: SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM
ispublished: pub
subjects: PL
subjects: QA75
divisions: tek_informatika
full_text_status: restricted
keywords: Identifikasi Bahasa, N-gram, Bahasa Jawa, Bahasa Indonesia.
abstract: Dalam beberapa tahun terakhir, jumlah akan ketersediaan dokumen semakin bertambah dan beragam seiring dengan berkembangnya internet. Namun, informasi maupun data yang ada bersifat heterogen dan tidak terstruktur sehingga sulit untuk dikumpulkan secara manual. Maka, dibutuhkan suatu sistem yang dapat melakukan pengidentifikasian bahasa secara otomatis menggunakan komputer, supaya lebih efisien jika dibandingkan dengan cara manual manusia.
Klasifikasi dokumen teks merupakan permasalahan mendasar dan penting. Mengingat bahwa bahasa Indonesia merupakan under resource langauge sama halnya dengan bahasa Jawa, maka identifikasi bahasa sangat diperlukan. Oleh karena itu, permasalahan ini merupakan masalah yang bisa dikatakan cukup kompleks dikarenakan penggunaan kata yang tergolong tidak sedikit. Salah satu metode yang dapat digunakan untuk mengklasifikasikan naskah dokumen tersebut adalah menggunakan n-gram. Sistem identifikasi bahasa Jawa dan bahasa Indonesia dengan karakter n-gram yang telah dikembangkan membuktikan bahwa berhasil mengidentifikasi bahasa dari sebuah naskah dokumen dengan nilai akurasi 85,07463%. Hal ini menunjukkan bahwa n-gram dapat diterapkan untuk mengidentifikasikan suatu naskah dokumen.
date: 2019-07
date_type: published
pages: 48
institution: Universitas Kristen Duta Wacana
department: Informatika
thesis_type: skripsi
thesis_name: other
citation:   71140005, Fidelia Vera Sentosa  (2019) SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM.  Bachelor thesis, Universitas Kristen Duta Wacana.   
document_url: https://katalog.ukdw.ac.id/382/1/71140005_bab1_bab5_daftarpustaka.pdf
document_url: https://katalog.ukdw.ac.id/382/2/71140005_bab2-sd-bab4_lampiran.pdf