PENGENALAN KARAKTER OPTIK (OCR) AKSARA JAWA DENGAN CONVOLUTION NEURAL NETWORK

71170183, Nathania Saphira (2021) PENGENALAN KARAKTER OPTIK (OCR) AKSARA JAWA DENGAN CONVOLUTION NEURAL NETWORK. Final Year Projects (S1) thesis, Universitas Kristen Duta Wacana.

[img] Text (Skripsi Informatika)
71170183_bab1_bab5_daftar pustaka.pdf

Download (2MB)
[img] Text (Skripsi Informatika)
71170183_bab2 s.d bab4_lampiran.pdf
Restricted to Registered users only

Download (3MB) | Request a copy

Abstract

Aksara Jawa merupakan salah satu peninggalan budaya Indonesia berupa tulisan tradisional dari suku Jawa yang meskipun saat ini sudah jarang digunakan, namun masih dilestarikan oleh berbagai pihak dalam bentuk fisik maupun digital. Dengan tujuan membantu mempermudah pelestarian aksara Jawa secara digital, penulis melakukan penelitian untuk mengembangkan sistem pengenalan karakter optik (OCR) dengan metode Convolutional Neural Network (CNN) yang dievaluasi berdasarkan parameter akurasi, presisi, recall, dan f1-score. Berfokus pada pengaplikasian salah satu arsitektur CNN, yaitu GoogLeNet yang menerapkan jaringan Inception, penulis melatih model dengan data hasil scan dari buku manuskrip lama dengan tulisan aksara Jawa yang tercetak yang sudah tersegmentasi. Data yang digunakan hanya data dengan jumlah minimal 10 data untuk setiap kelas karakternya. Model juga dilatih dengan berbagai variasi parameter serta penambahan lapisan normalisasi dan hasilnya divalidasi dan diuji berdasarkan metriks evaluasi akurasi, presisi, recall, dan f1-score untuk melihat seberapa baik performa CNN terhadap pelatihan model. Dari penelitian ini, didapatkan bahwa pelatihan model memiliki hasil yang paling baik jika dilatih dengan batch size ukuran 32 dan epoch sebanyak 100 dengan struktur arsitektur tanpa penggunaan lapisan normalisasi (Batch Normalization) dengan hasil evaluasi pengujian yang tidak terlalu tinggi (dibawah 70%). Namun, setelah dianalisis lebih dalam, penerapan CNN untuk melatih model agar dapat mengenali karakter optik aksara Jawa ini termasuk cukup efektif jika dianalisis dan dievaluasi secara weighted-averaged, mengingat jumlah data yang digunakan bervariasi setiap kelas karakternya.

Item Type: Student paper (Final Year Projects (S1))
Uncontrolled Keywords: Aksara Jawa, Convolutional Neural Network, CNN, GoogLeNet, Inception, OCR, akurasi, presisi, recall, f1-score, Batch Normalization
Subjects: P Bahasa dan Literatur > Bahasa dan Literatur Asia Timur, Afrika, Oseania
T Teknologi > Teknologi (Umum)
Divisions: Fakultas Teknologi Informasi > Prodi Informatika
Depositing User: Ms Nadya Agatha
Date Deposited: 14 Dec 2021 02:34
Last Modified: 14 Dec 2021 02:34
URI: http://katalog.ukdw.ac.id/id/eprint/6296

Actions (login required)

View Item View Item