TY - THES N1 - Rahmat Hidayat, S.Kom.,M.Cs ID - digilib34535 UR - https://digilib.uin-suka.ac.id/id/eprint/34535/ A1 - Kitami Akromunnisa, NIM. 15650036 Y1 - 2019/02/11/ N2 - Berbagai karya ilmiah dari sivitas akademika seperti skripsi, laporan penelitian, laporan kerja praktek dan lain sebagainya telah tersedia dalam versi digital. Namun, pada umumnya fenomena ini tidak disertai dengan pertumbuhan jumlah informasi atau pengetahuan yang dapat disarikan dari dokumen-dokumen elektronik tersebut. Penelitian ini bertujuan untuk melakukan klasifikasi pada data abstrak skripsi teknik informatika. Algoritma yang digunakan dalam penelitian ini adalah K-Nearest Neighbor. Jumlah data yang digunakan 50 data abstrak bahasa Indonesia, 454 data abstrak bahasa inggris dan 504 data judul. Masing-masing data dibagi menjadi data latih dan data uji. Data uji akan diklasifikasikan otomatis dengan model classifier yang telah dibuat. Berdasarkan penelitian yang dilakukan, klasifikasi data intisari bahasa Indonesia menghasilkan akurasi lebih besar tanpa melalui proses stemming yang memiliki rasio 9:1 yaitu 100,0 % dibandingkan dengan rasio 8:2 yaitu 90,0%, 7:3 yaitu 80,0%,6:4 yaitu 60,0% serta pembagian data menggunakan Kfold cross validation yaitu 80,0%. PB - UIN SUNAN KALIJAGA YOGYAKARTA KW - Klasifikasi KW - intisari bahasa Indonesia KW - abstrak bahasa inggris KW - judul skripsi KW - Stemming KW - K-Nearest Neighbor M1 - skripsi TI - KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-NEAREST NEIGHBOR AV - restricted EP - 125 ER -