PERBANDINGAN METODE CLUSTERING MENGGUNAKAN ALGORITMA K-MEANS DAN ALGORITMA K-MEDOIDS PADA PENGELOMPOKAN PERSEBARAN KASUS COVID-19 DI INDONESIA
Covid-19 merupakan penyakit yang muncul pada akhir tahun 2019, di mana penyebaran Covid-19 cukup cepat dan merata di Indonesia yang berdampak negatif bagi seluruh masyarakat Indonesia di berbagai bidang. Dibutuhkan sebuah pengelompokan berdasarkan daerah yang ada di Indonesia, untuk mengetahui titik-titik pusat penyebaran Covid-19 dan mengetahui daerah mana saja yang masuk ke dalam kategori penyebaran rendah, sedang, dan tinggi. Clustering merupakan metode data mining yang membagi data menjadi kelompok-kelompok yang mempunyai karakteristik yang sama. Metode dalam clustering yang digunakan yaitu algoritma K-Means dan algoritma K-Medoids, kedua algoritma tersebut akan dibandingkan dengan diuji menggunakan metode Sum Squared Error (SSE), Silhouette Coefficient (SC), dan Davies Index Bouldin (DBI). Berdasarkan perhitungan yang telah dilakukan di sub bab sebelumnya diperoleh hasil pengelompokan sebanyak tiga cluster pada kasus positif, kasus sembuh, dan kasus meninggal. Metode perhitungan jarak yang digunakan yaitu Chebyshev Distance, Manhattan Distance, dan Euclidean Distance menghasilkan pengelompokan data yang sama pada setiap cluster untuk perhitungan algortima K-Means dan K-Medoids menggunakan normalisasi min max, dan perhitungan algortima K-Means dan K-Medoids menggunakan normalisasi Z-Score. Hasil perhitungan algortima KMeans untuk kasus positif didapatkan 30 data masuk ke dalam cluster 1 (rendah), 2 data masuk ke dalam cluster 2 (tinggi), 2 data masuk ke dalam cluster 3 (sedang). Kasus sembuh didapatkan 30 data masuk ke dalam cluster 1 (rendah), 2 data masuk ke dalam cluster 2 (tinggi), 2 data masuk ke dalam cluster 3 (sedang). Kasus meninggal didapatkan 30 data masuk ke dalam cluster 1 (rendah), 2 data masuk ke dalam cluster 2 (sedang), 2 data masuk ke dalam cluster 3 (tinggi). Hasil perhitungan algoritma K-Medoids untuk kasus positif didapatkan 21 data masuk ke dalam cluster 1 (rendah), 9 data masuk ke dalam cluster 2 (sedang), 4 data masuk ke dalam cluster 3 (tinggi). Kasus sembuh didapatkan 21 data masuk ke dalam cluster 1 (rendah), 9 data masuk ke dalam cluster 2 (sedang), 4 data masuk ke dalam cluster 3 (tinggi). Kasus meninggal 2 data masuk ke dalam cluster 1 (tinggi), 24 data masuk ke dalam cluster 2 (rendah), 8 data masuk ke dalam cluster 3 (sedang). Berdasarkan pengujian Sum Squared Error (SSE) dapat disimpulkan algoritma K-Medoids memiliki nilai kesalahan acak terkecil dibandingkan dengan algoritma K-Means. Selanjutnya berdasarkan pengujian Sillhouette Coefficient dapat disimpulkan algoritma KMeans lebih unggul dalam kualitas dan kekuatan cluster yang dihasilkan, dan terakhir berdasarkan pengujian Davies Index Bouldin (DBI) menunjukkan algortima K-Means lebih unggul dari algoritma KMedoids berdasarkan kuantitas dan kedekatan antar anggota cluster.
Kata Kunci : K-Means, K-Medoids, Sum Squared Error, Silhouette Coefficient, Davies Index Bouldin.
Ketersediaan
Detail Information
Judul | PERBANDINGAN METODE CLUSTERING MENGGUNAKAN ALGORITMA K-MEANS DAN ALGORITMA K-MEDOIDS PADA PENGELOMPOKAN PERSEBARAN KASUS COVID-19 DI INDONESIA |
---|---|
Pengarang | GIDION LEMPAS - Personal Name |
No. Panggil | SKRIPSI GID p 2022 |
Subyek | K-Means, K-Medoids, Sum Squared Error, Silhouette |
Bahasa | Indonesia |
Tempat Terbit | Universitas Mulawarman |
Tahun Terbit | 2022 |
Penerbit | Fakultas Teknik |
Jurusan | Informatika |
Lampiran Berkas | LOADING LIST... |
DIGITAL LIBRARY