PEMBOBOTAN TF-IDF DAN METODE COSINE SIMILARITY UNTUK DETEKSI KEMIRIPAN DALAM PENGAJUAN TOPIK SKRIPSI DI UTDI

Hartanto, Satria Dwi (2023) PEMBOBOTAN TF-IDF DAN METODE COSINE SIMILARITY UNTUK DETEKSI KEMIRIPAN DALAM PENGAJUAN TOPIK SKRIPSI DI UTDI. Skripsi thesis, UNIVERSITAS TEKNOLOGI DIGITAL INDONESIA.

[img] Text (Halaman Depan)
1_195410229_HALAMAN_DEPAN.pdf - Published Version

Download (423kB)
[img] Text
2_195410229_BAB_I.pdf - Published Version

Download (306kB)
[img] Text
3_195410229_BAB_II.pdf - Published Version

Download (471kB)
[img] Text
4_195410229_BAB_III.pdf - Published Version
Restricted to Repository staff only

Download (533kB)
[img] Text
5_195410229_BAB_IV.pdf - Published Version
Restricted to Repository staff only

Download (1MB)
[img] Text
6_195410229_BAB_V.pdf - Published Version

Download (185kB)
[img] Text
7_195410229_DAFTAR_PUSTAKA.pdf - Published Version

Download (295kB)
[img] Text
8_195410229_CARA_MENJALANKAN_PROGRAM.pdf - Published Version

Download (366kB)
[img] Text
9_195410229_LISTING_PROGRAM.pdf - Published Version
Restricted to Repository staff only

Download (266kB)
[img] Text
10_195410229_LAMPIRAN.pdf - Published Version

Download (873kB)

Abstract

Dalam perkembangan teknologi sudah mempermudah mahasiswa dalam proses pencarian tema atau judul skripsi. Hal ini bisa mempunyai kelebihan dan kekurangan masing - masing. Selain itu hal ini dapat dijadikan referensi yang baik dengan banyaknya sumber referensi, sisi lainnya dapat memicu tingkat kemiripan judul yang beragam yang memicu plagiat yang tinggi sehingga menyebabkan kurang beragamnya topik atau judul penelitian. Proses pendeteksian kemiripan judul yang dilakukan oleh Universitas Teknologi Digital Indonesia masih sebatas membandingkan judul skripsi yang diajukan oleh mahasiswa oleh dosen pembimbing masing - masing. Hal ini akan berdampak kurang lengkapnya sumber informasi judul yang sudah di ajukan dalam basis data yang tersedia di Universitas Teknologi Digital Indonesia. Penelitian ini dilakukan untuk menguji tingkat kemiripan judul proposal skripsi yang akan diajukan dengan dibandingkan dengan judul yang sudah ada di Universitas Teknologi Digital Indonesia. Tahapan penelitian yang digunakan yaitu preprocessing (terdiri dari case folding, tokenizing, filtering, dan stemming), perhitungan pembobotan TF-IDF, dan perhitungan nilai kemiripan menggunakan cosine similarity. Penelitian ini diimplementasikan dalam bentuk web dengan bahasa pemrograman PHP dan basis data Mysql dan tambahan library sastrawi untuk proses preprocesing. Penelitian menunjukkan bahwa stemming mampu menghilangkan sebagian besar kesalahaan yang disebabkan oleh kata imbuhan: (ber, me, pe, ter, an, kan, di). Skenario penelitian dengan stemming menghasilkan nilai kemiripan rata-rata lebih tinggi 1.104% daripada tanpa stemming. Berdasarkan hasil percobaan cosine similarity dan pembobotan TF-IDF mampu menghasilkan nilai kemiripan dari masing-masing teks pembanding. Kata kunci : Cosine Similarity, Mysql, Preprocessing, PHP, Stemming, TF-IDF.

Item Type: Thesis (Skripsi)
Additional Information: Pembimbing : Pius Dian Anggoro, S, Si., M.Cs.
Uncontrolled Keywords: Cosine Similarity, Mysql, Preprocessing, PHP, Stemming, TF-IDF.
Subjects: A Karya Umum (General) > Ilmu Komputer (Computer Science) > Algoritma
A Karya Umum (General) > Ilmu Komputer (Computer Science) > Bahasa Pemrograman
A Karya Umum (General) > Ilmu Komputer (Computer Science) > Kecerdasan Buatan (Artificial Intelegence)
Divisions: Jenjang S1 > Informatika (S1)
Depositing User: Mr. Andi Setyanto
Date Deposited: 11 Okt 2023 02:47
Last Modified: 11 Okt 2023 03:08
URI: http://eprints.utdi.ac.id/id/eprint/10035

Actions (login required)

View Item View Item