YANTI, NOFI - 205610042 (2024) ALGORITMA CLUSTERING K-MEANS DALAM ANALISIS CLUSTER GAJI BERDASARKAN DATA DEMOGRAFI DENGAN MECHINE LEARNING MENGGUNAKAN PYTHON. Skripsi thesis, Universitas Teknologi Digital Indonesia.
Text (HALAMAN DEPAN)
205610042_HALAMAN_DEPAN.pdf - Published Version Download (964kB) |
|
Text (BAB I)
205610042_BAB_I.pdf - Published Version Download (474kB) |
|
Text (BAB II)
205610042_BAB_II.pdf - Published Version Download (829kB) |
|
Text (BAB III)
205610042_BAB_III.pdf - Published Version Restricted to Repository staff only Download (793kB) |
|
Text (BAB IV)
205610042_BAB_IV.pdf - Published Version Restricted to Repository staff only Download (1MB) |
|
Text (BAB V)
205610042_BAB_V.pdf - Published Version Download (579kB) |
|
Text (DAFTAR PUSTAKA)
205610042_DAFTAR_PUSTAKA.pdf - Published Version Download (336kB) |
|
Text (LAMPIRAN)
205610042_LAMPIRAN.pdf - Published Version Download (630kB) |
Abstract
Penelitian ini mengadopsi metode K-Means Clustering dalam analisis gaji berdasarkan data demografis, dengan tujuan memahami pola pengelompokan gaji karyawan berdasarkan faktor-faktor demografis yang relevan. Metode K-Means dipilih karena kemampuannya dalam mengelompokkan data secara efisien dan efektif, serta kemampuannya dalam menangani data unsupervised learning. Dalam konteks ini, KMeans dapat membantu mengidentifikasi pola pengelompokan gaji yang tidak terlihat secara langsung oleh analisis tradisional. Proses analisis dimulai dengan persiapan data dengan jumlah 3000 baris data, yang melibatkan pembersihan, transformasi data menjadi numerik, penghapusan outlier dan penskalaan . Langkah ini untuk memastikan kualitas data yang digunakan dalam analisis. Setelah itu, dilakukan pemilihan model dan klastering menggunakan algoritma K-Means dengan python. Proses ini melibatkan penentuan jumlah cluster yang optimal dengan metode elbow atau siku, dan pembentukan cluster menggunakan centroid dan pengelompokan objek berdasarkan jarak minimum ke centroid. Hasil evaluasi menunjukkan bahwa K-Means dengan 2 cluster optimal dimana cluster 1 terdapat 1518 data dengan rata-rata gaji Rp 7jt dan cluster 2 terdapat 1482 baris data dengan rata-rata gaji Rp 8jt. Dua cluster ini menghasilkan Silhouette Score sebesar 0.9972 mendekati 1 dan Davies-Bouldin Index sebesar 0.00178 mendekati nol, menunjukkan kualitas klastering yang sangat baik dan k=2 adalah nilai k yang paling optimal. Kata kunci: K-Means Clustering, Analisis Gaji, Davies-Bouldin Index , Silhouette Score
Item Type: | Thesis (Skripsi) |
---|---|
Additional Information: | Pembimbing: Deborah Kurniawati, S.Kom., M.Cs |
Uncontrolled Keywords: | K-Means Clustering, Analisis Gaji, Davies-Bouldin Index , Silhouette Score |
Subjects: | A Karya Umum (General) > Ilmu Komputer (Computer Science) > Algoritma A Karya Umum (General) > Ilmu Komputer (Computer Science) > Bahasa Pemrograman > Python |
Divisions: | Jenjang S1 > Sistem Informasi (S1) |
Depositing User: | Titis Pratiwi |
Date Deposited: | 28 Mar 2024 02:18 |
Last Modified: | 28 Mar 2024 02:18 |
URI: | http://eprints.utdi.ac.id/id/eprint/10329 |
Actions (login required)
View Item |