TY  - THES
N1  - Rahmat Hidayat, S.Kom.,M.Cs
ID  - digilib34535
UR  - https://digilib.uin-suka.ac.id/id/eprint/34535/
A1  - Kitami Akromunnisa, NIM. 15650036
Y1  - 2019/02/11/
N2  - Berbagai karya ilmiah dari sivitas akademika seperti skripsi, laporan penelitian, laporan kerja praktek dan lain sebagainya telah tersedia dalam versi digital. Namun, pada umumnya fenomena ini tidak disertai dengan pertumbuhan jumlah informasi atau pengetahuan yang dapat disarikan dari dokumen-dokumen elektronik tersebut.
Penelitian ini bertujuan untuk melakukan klasifikasi pada data abstrak skripsi teknik informatika. Algoritma yang digunakan dalam penelitian ini adalah K-Nearest Neighbor. Jumlah data yang digunakan 50 data abstrak bahasa Indonesia, 454 data abstrak bahasa inggris dan 504 data judul. Masing-masing data dibagi menjadi data latih dan data uji. Data uji akan diklasifikasikan otomatis dengan model classifier yang telah dibuat.
Berdasarkan penelitian yang dilakukan, klasifikasi data intisari bahasa Indonesia menghasilkan akurasi lebih besar tanpa melalui proses stemming yang memiliki rasio 9:1 yaitu 100,0 % dibandingkan dengan rasio 8:2 yaitu 90,0%, 7:3 yaitu 80,0%,6:4 yaitu 60,0% serta pembagian data menggunakan Kfold cross validation yaitu 80,0%.
PB  - UIN SUNAN KALIJAGA YOGYAKARTA
KW  - Klasifikasi
KW  -  intisari bahasa Indonesia
KW  -  abstrak bahasa inggris
KW  -  judul skripsi
KW  -  Stemming
KW  -  K-Nearest Neighbor
M1  - skripsi
TI  - KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-NEAREST NEIGHBOR
AV  - restricted
EP  - 125
ER  -