eprintid: 454 rev_number: 23 eprint_status: archive userid: 32 dir: disk0/00/00/04/54 datestamp: 2020-03-05 02:46:22 lastmod: 2021-06-23 02:19:55 status_changed: 2020-03-05 02:46:22 type: thesis metadata_visibility: show contact_email: repository@staff.ukdw.ac.id creators_name: 71140022, Stephani Nugroho creators_id: stephani.nugroho@ti.ukdw.ac.id contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_type: http://www.loc.gov/loc.terms/relators/THS contributors_name: Krisnawati, Lucia Dwi contributors_name: Suwarno, Sri corp_creators: Universitas Kristen Duta Wacana title: IDENTIFIKASI BAHASA JAWA VS INDONESIA DENGAN ALGORITMA PANJANG KATA BERBASIS LEKSIKON ispublished: pub subjects: PL subjects: QA75 divisions: tek_informatika full_text_status: restricted abstract: Identifikasi bahasa (Language Identifier) merupakan langkah awal dari sistem pemrosesan teks untuk menentukan suatu bahasa dimana teks yang digunakan tertulis. Sistem identifikasi bahasa yang akan dirancang lebih mengacu pada bahasa dengan sumber digital yang masih rendah (under-resourced languages) yaitu bahasa Jawa. Tujuan dari perancangan sistem ini adalah untuk mengidentifikasi dokumen kedua bahasa dengan algoritma Panjang Kata berbasis leksikon. Pada penelitian ini, penulis menggunakan metode panjang kata berbasis leksikon untuk mempercepat pencarian kata dari pembangunan leksikon kemudian membandingkan dokumen uji dengan hasil sistem. Pra-pemrosesan dalam penelitian ini terbagi dalam 2 tahap yaitu normalisasi yang terdiri dari case folding, dan tokenisasi. Proses pengecekan dilakukan dengan menggunakan algoritma panjang kata yang terbagi menjadi 8 kategori karakter huruf. Hasil output sistem berupa kalimat yang telah terindentifikasi sesuai dengan bahasa yang ditemukan. Nilai akhir sistem didapatkan dari presentase jumlah kalimat terbesar yang didapatkan dari total masing – masing kalimat dibagi dengan seluruh kalimat di dalam dokumen. Hasil akurasi yang didapatkan sebesar 100 % karena dokumen tersebut seluruhnya teridentifikasi kalimat baik Bahasa Indonesia maupun bahasa Jawa melalui penggunaan metode panjang kata berbasis leksikon. Kelemahan sistem adalah sistem mengindentifikasi kalimat Lain yang diperoleh jika jumlah kata bahasa Jawa sama dengan jumlah kata bahasa Indonesia. Hal ini disebabkan karena terdapat kata yang sama pada leksikon bahasa Jawa dan bahasa Indonesia sehingga teridentifikasi pada kedua bahasa. date: 2019-07 date_type: published pages: 49 institution: Universitas Kristen Duta Wacana department: Informatika thesis_type: skripsi thesis_name: other citation: 71140022, Stephani Nugroho (2019) IDENTIFIKASI BAHASA JAWA VS INDONESIA DENGAN ALGORITMA PANJANG KATA BERBASIS LEKSIKON. Final Year Projects (S1) thesis, Universitas Kristen Duta Wacana. document_url: https://katalog.ukdw.ac.id/454/1/71140022_bab1_bab5_daftarpustaka.pdf document_url: https://katalog.ukdw.ac.id/454/2/71140022_bab2-sd-bab4_lampiran.pdf