relation: https://katalog.ukdw.ac.id/382/ title: SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM creator: 71140005, Fidelia Vera Sentosa subject: PL Bahasa dan Literatur Asia Timur, Afrika, Oseania subject: QA75 Komputer Elektronik. Ilmu Komputer description: Dalam beberapa tahun terakhir, jumlah akan ketersediaan dokumen semakin bertambah dan beragam seiring dengan berkembangnya internet. Namun, informasi maupun data yang ada bersifat heterogen dan tidak terstruktur sehingga sulit untuk dikumpulkan secara manual. Maka, dibutuhkan suatu sistem yang dapat melakukan pengidentifikasian bahasa secara otomatis menggunakan komputer, supaya lebih efisien jika dibandingkan dengan cara manual manusia. Klasifikasi dokumen teks merupakan permasalahan mendasar dan penting. Mengingat bahwa bahasa Indonesia merupakan under resource langauge sama halnya dengan bahasa Jawa, maka identifikasi bahasa sangat diperlukan. Oleh karena itu, permasalahan ini merupakan masalah yang bisa dikatakan cukup kompleks dikarenakan penggunaan kata yang tergolong tidak sedikit. Salah satu metode yang dapat digunakan untuk mengklasifikasikan naskah dokumen tersebut adalah menggunakan n-gram. Sistem identifikasi bahasa Jawa dan bahasa Indonesia dengan karakter n-gram yang telah dikembangkan membuktikan bahwa berhasil mengidentifikasi bahasa dari sebuah naskah dokumen dengan nilai akurasi 85,07463%. Hal ini menunjukkan bahwa n-gram dapat diterapkan untuk mengidentifikasikan suatu naskah dokumen. date: 2019-07 type: Thesis type: NonPeerReviewed format: text language: id identifier: https://katalog.ukdw.ac.id/382/1/71140005_bab1_bab5_daftarpustaka.pdf format: text language: id identifier: https://katalog.ukdw.ac.id/382/2/71140005_bab2-sd-bab4_lampiran.pdf identifier: 71140005, Fidelia Vera Sentosa (2019) SISTEM IDENTIFIKASI BAHASA JAWA DAN BAHASA INDONESIA DOKUMEN TEKS BERBASIS KARAKTER N-GRAM. Bachelor thesis, Universitas Kristen Duta Wacana.