ANALISIS PERBANDINGAN TOPIC MODELLING LATENT DIRICHLET ALLOCATION DAN LATENT SEMANTIC ANALYSIS PADA BERITA DETIKFINANCE

Desy Portuna, NIM.: 20106050035 (2024) ANALISIS PERBANDINGAN TOPIC MODELLING LATENT DIRICHLET ALLOCATION DAN LATENT SEMANTIC ANALYSIS PADA BERITA DETIKFINANCE. Skripsi thesis, UIN SUNAN KALIJAGA YOGYAKARTA.

[img]
Preview
Text (ANALISIS PERBANDINGAN TOPIC MODELLING LATENT DIRICHLET ALLOCATION DAN LATENT SEMANTIC ANALYSIS PADA BERITA DETIKFINANCE)
20106050035_BAB-I_IV-atau-V_DAFTAR-PUSTAKA-1.pdf - Published Version

Download (1MB) | Preview
[img] Text (ANALISIS PERBANDINGAN TOPIC MODELLING LATENT DIRICHLET ALLOCATION DAN LATENT SEMANTIC ANALYSIS PADA BERITA DETIKFINANCE)
20106050035_BAB-II_sampai_SEBELUM-BAB-TERAKHIR-1.pdf - Published Version
Restricted to Registered users only

Download (2MB) | Request a copy

Abstract

Pemodelan topik menjadi teknik penting dalam analisis teks seiring dengan meningkatnya volume data teks tidak terstruktur. Teknik ini dapat mengidentifikasi tema tanpa perlu label kategori yang ditentukan sebelumnya. Metode yang digunakan dalam penelitian ini adalah Latent Dirichlet Allocation (LDA) dan Latent Semantic Analysis (LSA). Sebelumnya, penelitian komparatif pada kedua metode ini hanya menggunakan metrik nilai koherensi untuk evaluasi, namun penelitian ini menambahkan dua metrik tambahan, yaitu nilai keberagaman dan waktu pemrosesan, guna memberikan analisis performa yang lebih komprehensif. Penelitian ini bertujuan untuk membandingkan performa LDA dan LSA dalam pemodelan topik pada korpus bahasa Indonesia. Data yang digunakan adalah 1.837 artikel DetikFinance yang diambil melalui web scraping dalam rentang waktu Mei hingga Juli 2024. Tahapan penelitian meliputi pengumpulan data, prapemrosesan lalu pemodelan topik menggunakan LDA dan LSA. Selanjutnya, evaluasi dilakukan berdasarkan tiga metrik utama yaitu koherensi topik, keberagaman, dan waktu pemrosesan. Hasil penelitian menunjukkan bahwa LDA menghasilkan nilai koherensi dan keberagaman lebih tinggi dan stabil dibandingkan LSA. Hasil tersebut menunjukkan bahwa topik yang dihasilkan LDA relevan secara semantik serta bervariasi. Namun, dalam hal waktu pemrosesan LSA menunjukkan hasil yang lebih cepat. Dengan demikian, pemilihan metode pemodelan topik perlu disesuaikan dengan kebutuhan analisis, apakah lebih mementingkan struktur topik atau efisiensi waktu pemrosesan.

Item Type: Thesis (Skripsi)
Additional Information / Supervisor: Didik Rohmad Wahudi, S.T., MT
Uncontrolled Keywords: pemodelan topik, LDA, LSA, artikel berita, nilai koherensi, nilai keberagaman
Subjects: Tehnik Informatika
Divisions: Fakultas Sains dan Teknologi > Informatika (S1)
Depositing User: Widiyastuti, M.IP
Date Deposited: 22 Jan 2025 13:28
Last Modified: 22 Jan 2025 13:28
URI: http://digilib.uin-suka.ac.id/id/eprint/69587

Share this knowledge with your friends :

Actions (login required)

View Item View Item
Chat Kak Imum