eprintid: 382 rev_number: 19 eprint_status: archive userid: 34 dir: disk0/00/00/03/82 datestamp: 2020-02-19 02:51:56 lastmod: 2021-06-23 02:16:25 status_changed: 2020-02-19 02:51:56 type: thesis metadata_visibility: show contact_email: repository@staff.ukdw.ac.id creators_name: 71140005, Fidelia Vera Sentosa creators_id: fideliavera@ti.ukdw.ac.id contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_name: Krisnawati, Lucia Dwi contributors_name: Mahastama, Aditya Wikan corp_creators: Universitas Kristen Duta Wacana title: SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM ispublished: pub subjects: PL subjects: QA75 divisions: tek_informatika full_text_status: restricted keywords: Identifikasi Bahasa, N-gram, Bahasa Jawa, Bahasa Indonesia. abstract: Dalam beberapa tahun terakhir, jumlah akan ketersediaan dokumen semakin bertambah dan beragam seiring dengan berkembangnya internet. Namun, informasi maupun data yang ada bersifat heterogen dan tidak terstruktur sehingga sulit untuk dikumpulkan secara manual. Maka, dibutuhkan suatu sistem yang dapat melakukan pengidentifikasian bahasa secara otomatis menggunakan komputer, supaya lebih efisien jika dibandingkan dengan cara manual manusia. Klasifikasi dokumen teks merupakan permasalahan mendasar dan penting. Mengingat bahwa bahasa Indonesia merupakan under resource langauge sama halnya dengan bahasa Jawa, maka identifikasi bahasa sangat diperlukan. Oleh karena itu, permasalahan ini merupakan masalah yang bisa dikatakan cukup kompleks dikarenakan penggunaan kata yang tergolong tidak sedikit. Salah satu metode yang dapat digunakan untuk mengklasifikasikan naskah dokumen tersebut adalah menggunakan n-gram. Sistem identifikasi bahasa Jawa dan bahasa Indonesia dengan karakter n-gram yang telah dikembangkan membuktikan bahwa berhasil mengidentifikasi bahasa dari sebuah naskah dokumen dengan nilai akurasi 85,07463%. Hal ini menunjukkan bahwa n-gram dapat diterapkan untuk mengidentifikasikan suatu naskah dokumen. date: 2019-07 date_type: published pages: 48 institution: Universitas Kristen Duta Wacana department: Informatika thesis_type: skripsi thesis_name: other citation: 71140005, Fidelia Vera Sentosa (2019) SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM. Bachelor thesis, Universitas Kristen Duta Wacana. document_url: https://katalog.ukdw.ac.id/382/1/71140005_bab1_bab5_daftarpustaka.pdf document_url: https://katalog.ukdw.ac.id/382/2/71140005_bab2-sd-bab4_lampiran.pdf