Tugas Kapita Selekta Ilmu Komputer 1 1. IRIS a)Deskripsi Data Data “IRIS” merupakan data hasil pengukuran panjang dan lebarnya bagian bunga. Bagian bunga yang diukur panjang dan lebarnya adalah tangkai bunga dan kelopak bunga. Dari hasil pengukuran ini bunga dibedakan menjadi 3 class, yakni Iris Setosa, Iris Versicolour, Iris Virginica. b)Atribut Atribut yang ada di dalam database : sepalength : panjang tangkai dalam cm sepalwidth : lebar tangkai dalam cm petallength : panjang kelopak dalam cm petalwidth : lebar kelopak dalam cm
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Tugas Kapita Selekta Ilmu Komputer 1
1. IRISa) Deskripsi Data
Data “IRIS” merupakan data hasil pengukuran panjang dan lebarnya bagian bunga. Bagian bunga yang diukur panjang dan lebarnya adalah tangkai bunga dan kelopak bunga. Dari hasil pengukuran ini bunga dibedakan menjadi 3 class, yakni Iris Setosa, Iris Versicolour, Iris Virginica.
b) AtributAtribut yang ada di dalam database : sepalength : panjang tangkai dalam cm sepalwidth : lebar tangkai dalam cm petallength : panjang kelopak dalam cm petalwidth : lebar kelopak dalam cm
c) Class
Terdapat 3 class :-- Iris Setosa-- Iris Versicolour-- Iris Virginica
d) Jumlah InstanceJumlah instance dari database ini adalah 30 kelopak bunga.
e) Hasil ClusteringUntuk melakukan clustering, maka atribut class tidak akan menjadi atribut yang dicluster. Kemudian akan dilakukan clustering dan akan dijadikan 3 cluster menggunakan metode – metode di bawah ini :(1). Simple K-Means
AkurasiDengan setting seperti di bawah ini,
maka didapatkan hasil seperti di bawah ini :
Scheme: weka.clusterers.SimpleKMeans -N 3 -A "weka.core.EuclideanDistance -R first-last" -I 500 -S 10Relation: irisInstances: 30Attributes: 5 sepallength sepalwidth petallength petalwidthIgnored: classTest mode: evaluate on training data
=== Model and evaluation on training set ===
kMeans======
Number of iterations: 6Within cluster sum of squared errors: 1.913551539144951Missing values globally replaced with mean/mode
Data “Diabetes” merupakan data hasil pemeriksaan pasien untuk mendiagnosa penyakit diabetes.
b) AtributAtribut yang ada di dalam database : Preg : Jumlah kali hamil Plas : Konsentrasi glukosa plasma 2 jam dalam tes toleransi glukosa oral Prees : Tekanan darah diastolik (mm Hg) Skin : Ketebalan lipatan trisep (mm) Insu : Jam serum insulin (mu U / ml) Mass : Indeks massa tubuh (berat dalam kg / (tinggi dalam m) ^ 2) Pedi : Diabetes silsilah fungsi Age : Umur (Dalam Tahun)
c) Class
Ada 2 class yakni tested_positive dan tested_negative.
d) Jumlah InstanceJumlah instance dari database ini adalah 30.
e) Hasil ClusteringUntuk melakukan clustering, maka atribut class tidak akan menjadi atribut yang dicluster. Kemudian akan dilakukan clustering dan akan dijadikan 2 cluster menggunakan metode – metode di bawah ini :(1). Simple K-Means
AkurasiDengan setting seperti di bawah ini,
maka didapatkan :
Scheme: weka.clusterers.SimpleKMeans -N 2 -A "weka.core.EuclideanDistance -R first-last" -I 500 -S 10Relation: pima_diabetesInstances: 30Attributes: 9 preg plas pres skin insu mass pedi age
Ignored: classTest mode: evaluate on training data
=== Model and evaluation on training set ===
kMeans======
Number of iterations: 4Within cluster sum of squared errors: 12.010726677127337Missing values globally replaced with mean/mode
Data “Company” merupakan data fakta tentang perusahaan yang dipilih dari daftar Forbes 500 untuk tahun 1986. Di dalam data ini hanya memuat 1/10 dari data keseluruhan yang disusun secara sistematis berdasarkan abjad nama perusahaan. The Forbes 500 mencakup 500 perusahaan terbaik berdasarkan suatu kriteria.
b) AtributAtribut yang ada di dalam database :
Company : Nama Perusahaan Assets : Amount of assets (in millions) Sales : Jumlah penjualan (dalam jutaan) Market_Value : Nilai pasar perusahaan (dalam jutaan) Profits : Laba (dalam jutaan) Cash_Flow: Cash Flow (dalam jutaan) Employees: Jumlah karyawan (dalam ribuan) Sector: Jenis pasar perusahaan terkait dengan
c) Class
Tidak ada class.d) Jumlah Instance
Jumlah instance dari database ini adalah 30 perusahaan.
e) Hasil ClusteringJumlah klaster yang kan dibentuk adalah 4 klaster menggunakan metode – metode di bawah ini :(1). Simple K-Means
AkurasiDengan setting seperti di bawah ini,
maka didapatkan :
Scheme: weka.clusterers.SimpleKMeans -N 4 -A "weka.core.EuclideanDistance -R first-last" -I 500 -S 10Relation: relationInstances: 30Attributes: 8 Assets Sales Market_Value Profits Cash_Flow EmployeesIgnored: Company sectorTest mode: evaluate on training data
=== Model and evaluation on training set ===
kMeans======
Number of iterations: 6Within cluster sum of squared errors: 1.4707257092777661Missing values globally replaced with mean/mode