Sabtu, 08 Juni 2019

Penyelesaian Soal Menggunakan Klasifikasi K-Nearest Neighbor


Pengertian dan Cara Kerja Algoritma K-Nearest Neighbors (KNN)

K-nearest neighbors atau knn adalah algoritma yang berfungsi untuk melakukan klasifikasi suatu data berdasarkan data pembelajaran (train data sets), yang diambil dari k tetangga terdekatnya (nearest neighbors). Dengan k merupakan banyaknya tetangga terdekat.

* Cara Kerja Algoritma K-Nearest Neighbors (KNN)

K-nearest neighbors melakukan klasifikasi dengan proyeksi data pembelajaran pada ruang berdimensi banyak. Ruang ini dibagi menjadi bagian-bagian yang merepresentasikan kriteria data pembelajaran. Setiap data pembelajaran direpresentasikan menjadi titik-titik c pada ruang dimensi banyak.


Klasifikasi Terdekat (Nearest Neighbor Classification)

Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang dimensi banyak yang telah memuat titik-titik c data pembelajaran. Proses klasifikasi dilakukan dengan mencari titik c terdekat dari c-baru (nearest neighbor). Teknik pencarian tetangga terdekat yang umum dilakukan dengan menggunakan formula jarak euclideanBerikut beberapa formula yang digunakan dalam algoritma knn.

  • Euclidean Distance
    Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik dalam ruang dua dimensi.
    euclidean
Contoh Penyelesaian soal :
 



a)  hitunglah secara manual, x masuk kategori L/TL ?
b) cocokkan dengan penerapan di aplikasi Weka.
Jawab :
* Hal yang harus dikerjakan adalah menghitung eucledian distance
dengan rumus 
maka didapatkan hasil seperti ini :






* Hitung Manual mengambil contoh 10 data 

 * berikut adalah rumus di excel :
=SQRT((B2-G1)^2+(C2-H1)^2+(D2-I1)^2)
( tergantung letak tabel, bisa dimisalkan test1 (x), test2 (y), test3 (z)

* Untuk rumus ranking adalah :
=RANK.AVG(G3;$G$2:$G$101;1)

*Ketika eqludiance distance sudah selesai dihitung dan sudah mengurutkan hasil dari terkecil ke terbesar maka langkah selanjutnya adalah menentukan k.
Disini saya menentukan k=3, maka akan diperoleh hasil sebagai berikut :


* Kesimpulan :
ketiga data tersebut masuk di kategori L, maka X bisa dipastikan masuk di kategori L.

* Pembuktian di Aplikasi Weka

·         Pengerjaan melalui aplikasi Weka

a.       Buka aplikasi weka, kemudian klik explorer

b.       Kemudian klik open file untuk membuka data dalam bentuk CSV atau arff




c.       Pilih file yang akan di masukkan dalam aplikasi weka, untuk type datanya boleh diubah dalam CSV ( karena saya memakai format CSV )



d.       Gambar dibawah ini merupakan tampilan ketika data berhasil di buka di aplikasi weka.





e.       Karena akan menghitung KNN maka kita rubah dulu settingan perhitungannya dengan cara klik classify , kemudian klik choose



f.        Kemudian klik choose dan pilih “lazy” kemudian klik IBK





g.       Kemudian untuk crossvalidasinya diganti dengan “5”, dan klik tulisan ibk yang saya lingkari dibawah ini



h.         Ketika sudah di klik maka akan tertampil seperti dibawah ini, kemudian KNN nya diganti dengan “3” lalu klik ok



i.         Maka akan tertampil hitungan knn seperti dibawah ini, berikut adalah hasil penghitungan menggunakan Weka dengan metode KNN.





Semoga bermanfaat untuk kalian semua tutorial pengerjaan data mining dengan metode KNN :)



1 komentar:

  1. Can titanium rings be resized? - Titanium Art
    Can Titanium titanium rod in leg rings be resized? - titanium belt buckle Iron and t fal titanium Diamond, a gold metallic alloy in a titanium white octane blueprint stainless steel structure. I would give you a very good idea how much burnt titanium can I

    BalasHapus