STUDI EKSPERIMENTASI KEAKURATAN TESSERACT-OCR DALAM PENGENALAN HURUF KOREA (HANGEUL)

Nurahmad Miftahudin, NIM : 17106050032 (2023) STUDI EKSPERIMENTASI KEAKURATAN TESSERACT-OCR DALAM PENGENALAN HURUF KOREA (HANGEUL). Skripsi thesis, UIN SUNAN KALIJAGA YOGYAKARTA.

[img]
Preview
Text (STUDI EKSPERIMENTASI KEAKURATAN TESSERACT-OCR DALAM PENGENALAN HURUF KOREA (HANGEUL))
18106010032_BAB-I_IV-atau-V_DAFTAR-PUSTAKA.pdf - Published Version

Download (2MB) | Preview
[img] Text (STUDI EKSPERIMENTASI KEAKURATAN TESSERACT-OCR DALAM PENGENALAN HURUF KOREA (HANGEUL))
18106010032_BAB-II_sampai_SEBELUM-BAB-TERAKHIR.pdf - Published Version
Restricted to Registered users only

Download (5MB) | Request a copy

Abstract

Banyaknya peminat tentang budaya Korea yang sudah berlangsung lama menarik minat peneliti untuk melakukan penelitian ini, walaupun sudah lama budaya Korea menarik perhatian negara lain salah satunya adalah grup idol Korea. Huruf korea kemudian menarik minat penulis untuk melakukan pengujian pengenalan huruf pada subtitle salah satu MV atau Music Video grup wanita yaitu fromis_9 yang berjudul DM. Dalam penelitian ini penulis menggunakan Tesseract-OCR. Penulis mencoba menggunakan Tesseract-OCR untuk melakukan pengujian pengenalan huruf Korea (Hangeul) dalam lirik musik video fromis_9 yang berjudul DM. Peneliti menggunakan Tesseract-OCR untuk melihat seberapa akurat Tesseract-OCR dapat mengenali huruf korea yang memiliki latar belakang gambar berwarna dan telah dilakukan image processing. Data uji yang digunakan berupa 207 tangkapan layar dari MV fromis_9 DM yang tercantum subtitle lirik berbahasa Korea dan terdapat juga huruf alfabet dan terbagi menjadi tiga ukuran huruf yaitu 18pt, 24pt, dan 48 yang masing-masing ukuran huruf memiliki 69 gambar uji. Gambar data uji tersebut kemudian juga di proses menggunakan beberapa image processing seperti grayscaling, thresholding, dan gaussian blur, dan canny. Pada penelitian ini penulis mengelompokkan data uji menjadi tiga, yaitu huruf korea dan alfabet, hanya huruf korea, hanya alfabet kemudian diperoleh hasil dengan persentase keberhasilan dalam melakukan pengenalan huruf dan benar terbaik sebesar 100% dan persentase terburuk 0%. Pada kelompok huruf korea dan alfabet ukuran huruf 24pt memiliki tingkat keberhasilan paling tinggi yaitu 67% dan ukuran huruf 48pt terendah sebesar 53% dan ukuran huruf 18pt berada di tengah dengan persentase 63%. Untuk kelompok hanya korea ukuran huruf 18pt mendapat 65%, ukuran huruf 24pt 66%, dan ukuran huruf 48pt 56%. Kelompok hanya alfabet dianggap berhasil jika tidak ada kotak yang muncul, karena fokus penelitian hanya untuk mendeteksi huruf korea, ada beberapa kasus gambar yang terdeteksi satu kotak pada kata huruf alfabet akan tetapi lebih banyak yang tidak muncul kotak.

Item Type: Thesis (Skripsi)
Additional Information: Pembimbing:Ir. Maria Ulfah Siregar, S.Kom., MIT., Ph.D.
Uncontrolled Keywords: Tesseract-OCR; Huruf Korea; image processing
Subjects: Tehnik Informatika
Divisions: Fakultas Sains dan Teknologi > Teknik Informatika (S1)
Depositing User: Widiyastut
Date Deposited: 19 Oct 2023 14:06
Last Modified: 19 Oct 2023 14:06
URI: http://digilib.uin-suka.ac.id/id/eprint/61514

Share this knowledge with your friends :

Actions (login required)

View Item View Item
Chat Kak Imum