ALGORITMA CLUSTERING K-MEANS DALAM ANALISIS CLUSTER GAJI BERDASARKAN DATA DEMOGRAFI DENGAN MECHINE LEARNING MENGGUNAKAN PYTHON

YANTI, NOFI - 205610042 (2024) ALGORITMA CLUSTERING K-MEANS DALAM ANALISIS CLUSTER GAJI BERDASARKAN DATA DEMOGRAFI DENGAN MECHINE LEARNING MENGGUNAKAN PYTHON. Skripsi thesis, Universitas Teknologi Digital Indonesia.

[img] Text (HALAMAN DEPAN)
205610042_HALAMAN_DEPAN.pdf - Published Version

Download (964kB)
[img] Text (BAB I)
205610042_BAB_I.pdf - Published Version

Download (474kB)
[img] Text (BAB II)
205610042_BAB_II.pdf - Published Version

Download (829kB)
[img] Text (BAB III)
205610042_BAB_III.pdf - Published Version
Restricted to Repository staff only

Download (793kB)
[img] Text (BAB IV)
205610042_BAB_IV.pdf - Published Version
Restricted to Repository staff only

Download (1MB)
[img] Text (BAB V)
205610042_BAB_V.pdf - Published Version

Download (579kB)
[img] Text (DAFTAR PUSTAKA)
205610042_DAFTAR_PUSTAKA.pdf - Published Version

Download (336kB)
[img] Text (LAMPIRAN)
205610042_LAMPIRAN.pdf - Published Version

Download (630kB)

Abstract

Penelitian ini mengadopsi metode K-Means Clustering dalam analisis gaji berdasarkan data demografis, dengan tujuan memahami pola pengelompokan gaji karyawan berdasarkan faktor-faktor demografis yang relevan. Metode K-Means dipilih karena kemampuannya dalam mengelompokkan data secara efisien dan efektif, serta kemampuannya dalam menangani data unsupervised learning. Dalam konteks ini, KMeans dapat membantu mengidentifikasi pola pengelompokan gaji yang tidak terlihat secara langsung oleh analisis tradisional. Proses analisis dimulai dengan persiapan data dengan jumlah 3000 baris data, yang melibatkan pembersihan, transformasi data menjadi numerik, penghapusan outlier dan penskalaan . Langkah ini untuk memastikan kualitas data yang digunakan dalam analisis. Setelah itu, dilakukan pemilihan model dan klastering menggunakan algoritma K-Means dengan python. Proses ini melibatkan penentuan jumlah cluster yang optimal dengan metode elbow atau siku, dan pembentukan cluster menggunakan centroid dan pengelompokan objek berdasarkan jarak minimum ke centroid. Hasil evaluasi menunjukkan bahwa K-Means dengan 2 cluster optimal dimana cluster 1 terdapat 1518 data dengan rata-rata gaji Rp 7jt dan cluster 2 terdapat 1482 baris data dengan rata-rata gaji Rp 8jt. Dua cluster ini menghasilkan Silhouette Score sebesar 0.9972 mendekati 1 dan Davies-Bouldin Index sebesar 0.00178 mendekati nol, menunjukkan kualitas klastering yang sangat baik dan k=2 adalah nilai k yang paling optimal. Kata kunci: K-Means Clustering, Analisis Gaji, Davies-Bouldin Index , Silhouette Score

Item Type: Thesis (Skripsi)
Additional Information: Pembimbing: Deborah Kurniawati, S.Kom., M.Cs
Uncontrolled Keywords: K-Means Clustering, Analisis Gaji, Davies-Bouldin Index , Silhouette Score
Subjects: A Karya Umum (General) > Ilmu Komputer (Computer Science) > Algoritma
A Karya Umum (General) > Ilmu Komputer (Computer Science) > Bahasa Pemrograman > Python
Divisions: Jenjang S1 > Sistem Informasi (S1)
Depositing User: Titis Pratiwi
Date Deposited: 28 Mar 2024 02:18
Last Modified: 28 Mar 2024 02:18
URI: http://eprints.utdi.ac.id/id/eprint/10329

Actions (login required)

View Item View Item