%L katalog2211 %D 2016 %I Universitas Kristen Duta Wacana %X Data mentah yang terdapat dalam dokumen teks biasanya tidak terstruktur bentuknya sehingga tidak bisa digunakan untuk mendapatkan informasi secara baik. Oleh karena itu, diterapkan text preprocessing untuk mengolah suatu data mentah yang berupa teks. Salah satu penerapan text preprocessing adalah spelling correction. Dalam spelling correction terdapat teknik yang mengoreksi term tanpa memperhatikan konteks dari teks. Teknik tersebut bernama isolated-word error correction. Sebelum melakukan koreksi, diperlukan tahap nonword error detection yang berfungsi untuk memeriksa ejaan pada suatu term. Dalam penelitian ini penulis meneliti penerapan nonword error detection dan penggunaan Dice coefficient untuk melakukan isolated-word error correction serta Damerau-Levenshtein distance dan word frequency. Penulis juga meneliti pengaruh teknik tokenisasi pada k-gram menggunakan kombinasi susunan karakter. Evaluasi dilakukan menggunakan nilai precision, recall, dan f-measure pada 100 dokumen teks yang diambil dari ICL-corpus. Evaluasi dilakukan terhadap proses deteksi kesalahan dan koreksi kesalahan. Pada evaluasi koreksi kesalahan, setiap kombinasi metode yang menggunakan koefisien Dice akan dievaluasi berdasarkan variasi nilai threshold Dice, yaitu sebesar 0.2, 0.4, 0.6, dan 0.8. Pada evaluasi deteksi kesalahan, didapat nilai f-measure sebesar 0.86517. Sedangkan kombinasi metode yang dapat memberikan hasil koreksi terbaik adalah bigram kombinasi yang menggunakan koefisien Dice, Damerau-Levenshtein, dan frekuensi term pada nilai threshold Dice sebesar 0.2. Nilai f-measure dari metode tersebut adalah 0.50112. %A AMADEA KRISTINA BUDIMAN 71110057 %T ISOLATED-WORD ERROR CORRECTION PADA TEKS BERBAHASA INDONESIA %K Damerau-Levenshtein, Dice coefficient, isolated-word error correction, nonword error detection, word frequency