HermanAnis.com– Solusi Ujian Akhir Semester Mata Kuliah Statistika Data Sains (UAS) Prodi Pendidikan IPA tahun 2020 untuk soal essai. Dari 4 soal yang diujikan, saya memilih dua soal untuk diselesaikan, yakni soal No. 2 dan 3. Soal lengkap Ujian Akhir Semester (UAS) Statistika Data Sains dapat anda lihat di link berikut Soal UAS Statistika Data Sains (UAS) Tahun 2020)
Solusi UAS Statistika Data Sains No. 2
Pada Table 1 disajikan harga (P) dan kualitas (Q) dari 6 merek minuman
i. Sajian data dalam diagram dua dimensi:
ii. Tentukan matrix similaritasnya!
Untuk mencari kuadrat jarak Euclid sebagai ukuran similaritas dengan persamaan:
Dimana Dij2 merupakan adalah kuadrat jarak Euclid antara subyek-subyek i dan j, adalah nilai dari variable ke k untuk subyek ke i, dan adalah nilai dari variable ke k untuk subyek ke j, dan p adalah banyaknya variabel. Berdasarkan Tabel 2.1 dan persamaan kuadrat jarak Euclid antara subyek-subyek dilakukan analisis manual (Microsoft Excel 2010) dan diperoleh matrix similaritas sebagai berikut:
iii. Gunakan metode centroid dan complete-linkage method untuk melakukan cluster hirarkhi untuk keenam merek ini. Bandingkan hasilnya dengan diagram pada i)
- Metode centroid
Berdasarkan Tabel 1, terlihat bahwa kuadrat jarak Euclid dari merek D dan F terkecil diantara yang lain. Sehingga cluster pertama dapat dibentuk dengan menggabungkan merek D dan F, yang artinya cluster pertama rata-rata harga (P) =(6,39+6,25)/2 = 6,32 Dollar dan rata kualitas (Q) = (7+6)/2 = 6,50. Tabel 2.3, menyajikan data 5 cluster yang baru.
Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 5 cluster diberikan dalam Tabel 2.4.
Seperti yang terlihat dalam Tabel 2.4. merek A dan C mempunyai jarak terkecil, diantara yang lain, sehingga kita dapat mengelompokkan kedua merek ini menjadi satu cluster baru (kelompok baru) yakni merek A&C. Tabel 2.5, menyajikan data 4 cluster yang baru.
Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 4 cluster diberikan dalam Tabel 2.6
Seperti yang terlihat dalam Tabel 2.6. merek B dan E mempunyai jarak terkecil, diantara yang lain, sehingga kita dapat mengelompokkan kedua merek ini menjadi satu cluster baru (kelompok baru) yakni merek B&E. Tabel 2.7, menyajikan data 3 cluster yang baru
Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 3 cluster diberikan dalam Tabel 2.8.
Sampai disini, maka dapat disimpulkan jika 6 Merek tersebut akan dikelompokkan dalam 3 cluster dengan menggunakan metode centroid maka yang paling memungkinkan adalah cluster pertama merek D&F, cluster kedua merek A&C, dan cluster ketiga merek B&E.
Jika analis dialanjutkan dengan cara yang sama maka dapat diprediksi bahwa untuk pengelompokan menjadi 2 cluster maka yang paling memungkinkan adalah menggabungkan antara merek D, F, A & C sebagai cluster pertama dan merek B&E sebagai cluster kedua.
Hasil dendogram denganmetode centroid diberikan dalam gambar di bawah ini.
2. Metode complete-linkage method
Tabel 2.2. Matrix similaritas yang memuat kuadrat jarak Euclid,
Pertama-tama dibentuk cluster 1 dengan melebur Merek D dan F menjadi cluster pertama.
Jarak diantara cluster 1 dengan Merek A adalah nilai maximum dari jarak-jarak berikut ini, DDA2 =11,25 dan DFA2= 18,69 Sehingga dipilih 18,69 (Nilai Maksimum).
Jarak diantara cluster 1 dengan Merek B adalah nilai maximum dari jarak-jarak berikut ini, DDB2 =11,56 dan DFB2= 6,13 Sehingga dipilih 11,56 (Nilai Maksimum), dan seterusnya.
Dengan menggunakan aturan tadi maka matrix similaritas setelah Langkah pertama (yaitu solusi lima cluster) diberikan dalam Tabel 2.8.
Berdasarkan Tabel 2.8, terlihat bahwa merek A dan C dapat digabungkan menjadi satu cluster yakni cluster A&C (memiliki kuadrat jarak Euclid terkecil diantara yang lain).
Dengan cara yang sama sebelumnya maka akan diperoleh matrix similaritas solusi empat cluster diberikan dalam Tabel 2.9.
Berdasarkan Tabel 2.9, terlihat bahwa merek B dan E dapat digabungkan menjadi satu cluster yakni cluster B&E (memiliki kuadrat jarak Euclid terkecil diantara yang lain). Dengan cara yang sama sebelumnya maka diperoleh matrix similaritas solusi tiga cluster diberikan dalam Tabel 2.10.
Sampai disini, maka dapat disimpulkan jika 6 merek tersebut akan dikelompokkan dalam 3 cluster dengan menggunakan complete-linkage method maka yang paling memungkinkan adalah cluster pertama merek D&F, cluster kedua merek A&C, dan cluster ketiga merek B&E.
Jika analis dilanjutkan dengan cara yang sama maka dapat diprediksi bahwa untuk pengelompokan menjadi 2 cluster, yang paling memungkinkan adalah menggabungkan antara merek D, F, A & C sebagai cluster pertama dan merek B&E sebagai cluster kedua.
Hasil dendogram dengan complete-linkage method diberikan dalam gambar di bawah ini.
Jika dibandingkan dengan diagram pada i) dimana pada plot diagram terlihat secara langsung potensi pengelompokan yang dapat dilakukan untuk keenam merek menjadi 3 kelompok yakni:
Cluster 1 (B&E). Gabungan Merek B dan E
Cluster 2 (D&F). Gabungan Merek D dan F
Cluster 3 (A&C) Gabungan Merek A dan C
Hasil ini menunjukkan ada kesesuaian antara hasil dari dengan metode centroid dan complete-linkage method.
Solusi soal essai No. 3
Perhatikan model dua –factor dengan 6 indicator berikut ini:
Asumsi yang berlaku untuk model ini adalah: mean dari indicator-indicator, common factor, dan unique factor adalah nol, dan variance common factor adalah 1. Berdasarkan informasi dari soal No. 3 data kemudian diinput dan dianalisis dengan Microsoft Excel 2010, sehingga diperoleh Pattern Loading, Struktur Loading, Shared Variance dan Percentage dari Shared Variance diberikan pada tabel di bawah ini:
- Pattern loading untuk indicator indicator X1, X2, dan X5 untuk faktor F1 adalah:
X1 = 0,558 X3 = 0,469 X5 = 0,866
Pattern loading untuk indicator indicator X1, X2, dan X5 untuk faktor F2 adalah:
X1= 0,615 X3= 0,556, X5 = -0,466 - Structure loading untuk indicator X1, X3, dan X5 untuk faktor F1 adalah:
X1 = 0,558 X3 = 0,469 X5 = 0,866
Structure loading untuk indicator X1, X3, dan X5 untuk faktor F2 adalah:
X1= 0,615 X3= 0,556, X5 = -0,466 - Besar korelasi diantara indicator-indicator X1 dan X2, yakni:
(0,558 x 0,604) + (0,615 x 0,748) = 0,79705
Besar korelasi antara indikator X3 dan X4, yakni:
(0,469 x 0,818) + (0,556 x -0,411) = 0,15513
Besar korelasi antara indikator X5 dan X6, yakni:
(0,866 x 0,686) + (-0,466 x -0,461) = 0.8089
Jika analisis dilanjutkan untuk korelasi antara indikator-indikator lain maka akan diperoleh:
Persentase dari shared variance terkait dengan indicator –indicator X1, X2, dan X3
Variabel F1:
X1= (0.311 ÷ 2.786) x 100% = 11.2%
X2= (0.365 ÷ 2.786) x 100% = 13.1%
X3= (0.220 ÷ 2.786) x 100% = 7.9%
Jumlah = 32,2%.
Cara lain akan memperoleh hasil yang sama (0,311+0,365+0,220)/2,786 = 0,3216 atau sekitar 32,2 %.
Variabel F2 :
X1= (0.378 ÷ 1.845) x 100% = 20.5%
X2 = (0.560 ÷ 1.845) x 100% = 30.3%
X3 = (0.309 ÷ 1.845) x 100% = 16.8%
Jumlah = 67,6%.
Cara lain akan memperoleh hasil yang sama (0,378+0,560+0,309)/1,845 = 0,6758 atau sekitar 67,6 %.
Berdasarkan hasil tersebut maka commom factor F2 lebih tepat mengukur indikator X1, X2, dan X3, jika dibandingkan dengan dengan commom factor F1. Hal ini disebabkan oleh karnea communality-communality atau shared variances dari variabel X1, X2, dan X3 dengan Faktor F2 (67,6 %.) jauh lebih besar daripada communality-communality atau shared variances dari variabel X1, X2, dan X3 dengan Faktor F1 (32,2%).
Demikian Solusi UAS Statistika Data Sains tahun 2021. Mudah-mudahan bermanfaat.
=Baca juga=
Materi Pembinaan KSN Fisika 2021
Salam Sehat
Herman
Eksplorasi konten lain dari Herman Anis
Berlangganan untuk dapatkan pos terbaru lewat email.