Solusi Ujian Akhir Semester (UAS) Statistika Data Sains Bagian 2 – Soal Essai

HermanAnis.com– Solusi Ujian Akhir Semester Mata Kuliah Statistika Data Sains (UAS) Prodi Pendidikan IPA tahun 2020 untuk soal essai. Dari 4 soal yang diujikan, saya memilih dua soal untuk diselesaikan, yakni soal No. 2 dan 3. Soal lengkap Ujian Akhir Semester (UAS) Statistika Data Sains dapat anda lihat di link berikut Soal UAS Statistika Data Sains (UAS) Tahun 2020)

Isi Tulisan

Solusi UAS Statistika Data Sains No. 2

Pada Table 1 disajikan harga (P) dan kualitas (Q) dari 6 merek minuman

Rating kualitas: 10 = kualitas terbaik; 1 = kualitas terjelek
Harga dalam dollar untuk tiap kotak (berisi 12 kaleng)

i. Sajian data dalam diagram dua dimensi:

Melalui plot diagram terlihat secara sepintas pengelompokan yang dapat dilakukan untuk keenam merek menjdi 3 kelompok yakni:
Cluster 1. Gabungan Merek B dan E
Cluster 2. Gabungan Merek D dan F
Cluster 3. Gabungan Merek A dan C

ii. Tentukan matrix similaritasnya!

Untuk mencari kuadrat jarak Euclid sebagai ukuran similaritas dengan persamaan:

Dimana Dij2 merupakan adalah kuadrat jarak Euclid antara subyek-subyek i  dan j, adalah nilai dari variable ke k  untuk subyek ke i,  dan  adalah nilai dari variable ke k  untuk subyek ke j, dan p adalah banyaknya variabel. Berdasarkan Tabel 2.1 dan persamaan kuadrat jarak Euclid antara subyek-subyek dilakukan analisis manual (Microsoft Excel 2010) dan diperoleh matrix similaritas sebagai berikut:

Telah dilakukan pembulatan dua angka di belakang koma.

iii. Gunakan metode centroid dan complete-linkage method untuk melakukan cluster hirarkhi untuk keenam merek ini. Bandingkan hasilnya dengan diagram pada i)

  1. Metode centroid
    Berdasarkan Tabel 1, terlihat bahwa kuadrat jarak Euclid  dari merek D dan F terkecil diantara yang lain. Sehingga cluster pertama dapat dibentuk dengan menggabungkan merek D dan F, yang artinya cluster pertama  rata-rata harga (P) =(6,39+6,25)/2 = 6,32 Dollar dan rata kualitas (Q) = (7+6)/2 = 6,50. Tabel 2.3, menyajikan data 5 cluster yang baru.

Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 5 cluster diberikan dalam Tabel 2.4.

Seperti yang terlihat dalam Tabel 2.4. merek A dan C mempunyai jarak terkecil, diantara yang lain, sehingga kita dapat mengelompokkan kedua merek ini  menjadi satu cluster baru (kelompok baru) yakni merek A&C. Tabel 2.5, menyajikan data 4 cluster yang baru.

Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 4 cluster diberikan dalam Tabel 2.6

Seperti yang terlihat dalam Tabel 2.6. merek B dan E mempunyai jarak terkecil, diantara yang lain, sehingga kita dapat mengelompokkan kedua merek ini  menjadi satu cluster baru (kelompok baru) yakni merek B&E. Tabel 2.7, menyajikan data 3 cluster yang baru

Dengan menggunakan persamaan 2.1 untuk menghitung kuadrat jarak Euclid, maka matrix similaritas diantara 3 cluster diberikan dalam Tabel 2.8.

Sampai disini, maka dapat disimpulkan jika 6 Merek tersebut akan dikelompokkan dalam 3 cluster dengan menggunakan metode centroid maka yang paling memungkinkan adalah cluster  pertama merek D&F, cluster kedua merek A&C, dan cluster ketiga merek B&E.
Jika analis dialanjutkan dengan cara yang sama maka dapat diprediksi bahwa untuk pengelompokan menjadi 2 cluster maka yang paling memungkinkan adalah menggabungkan antara merek D, F, A & C sebagai cluster pertama dan  merek B&E sebagai cluster kedua.

Hasil dendogram denganmetode centroid diberikan dalam gambar di bawah ini.

2. Metode complete-linkage method
Tabel 2.2. Matrix similaritas yang memuat kuadrat jarak Euclid,

Pertama-tama dibentuk cluster 1 dengan melebur Merek D dan F menjadi cluster pertama.
Jarak diantara cluster 1 dengan Merek A adalah nilai maximum dari jarak-jarak berikut ini, DDA2 =11,25 dan DFA2= 18,69 Sehingga dipilih 18,69 (Nilai Maksimum).
Jarak diantara cluster 1 dengan Merek B adalah nilai maximum dari jarak-jarak berikut ini, DDB2 =11,56 dan DFB2= 6,13 Sehingga dipilih  11,56 (Nilai Maksimum), dan seterusnya.
Dengan menggunakan aturan tadi maka matrix similaritas setelah Langkah pertama (yaitu solusi lima cluster) diberikan dalam Tabel 2.8.

Berdasarkan Tabel 2.8, terlihat bahwa merek A dan C dapat digabungkan menjadi satu cluster yakni cluster A&C (memiliki kuadrat jarak Euclid terkecil diantara yang lain).

Dengan cara yang sama sebelumnya maka akan diperoleh matrix similaritas solusi empat cluster diberikan dalam Tabel 2.9.

Berdasarkan Tabel 2.9, terlihat bahwa merek B dan E dapat digabungkan menjadi satu cluster yakni cluster B&E (memiliki kuadrat jarak Euclid terkecil diantara yang lain). Dengan cara yang sama sebelumnya maka diperoleh matrix similaritas solusi tiga cluster diberikan dalam Tabel 2.10.

Sampai disini, maka dapat disimpulkan jika 6 merek tersebut akan dikelompokkan dalam 3 cluster dengan menggunakan complete-linkage method maka yang paling memungkinkan adalah cluster  pertama merek D&F, cluster kedua merek A&C, dan cluster ketiga merek B&E.

Jika analis dilanjutkan dengan cara yang sama maka dapat diprediksi bahwa untuk pengelompokan menjadi 2 cluster, yang paling memungkinkan adalah menggabungkan antara merek D, F, A & C sebagai cluster pertama dan  merek B&E sebagai cluster kedua.

Hasil dendogram dengan complete-linkage method diberikan dalam gambar di bawah ini.

Jika dibandingkan dengan diagram pada i) dimana pada plot diagram terlihat secara langsung potensi pengelompokan yang dapat dilakukan untuk keenam merek menjadi 3 kelompok yakni:

Cluster 1 (B&E). Gabungan Merek B dan E
Cluster 2 (D&F). Gabungan Merek D dan F
Cluster 3 (A&C) Gabungan Merek A dan C

Hasil ini menunjukkan ada kesesuaian antara hasil dari dengan metode centroid dan complete-linkage method.

Solusi soal essai No. 3

Perhatikan model dua –factor dengan 6 indicator berikut ini:

Asumsi yang berlaku untuk model ini adalah: mean dari indicator-indicator, common factor, dan unique factor adalah nol, dan variance common factor adalah 1. Berdasarkan informasi dari soal No. 3 data kemudian diinput dan dianalisis dengan Microsoft Excel 2010, sehingga diperoleh Pattern Loading, Struktur Loading, Shared Variance dan Percentage dari Shared Variance diberikan pada tabel di bawah ini:

  1. Pattern loading untuk indicator indicator X1, X2, dan X5 untuk faktor F1 adalah:
    X1 = 0,558       X3 = 0,469       X5 = 0,866
    Pattern loading untuk indicator indicator X1, X2, dan X5 untuk faktor F2 adalah:
    X1= 0,615        X3= 0,556,      X5 = -0,466    
  2. Structure loading untuk indicator X1, X3, dan X5 untuk faktor F1 adalah:
    X1 = 0,558       X3 = 0,469       X5 = 0,866
    Structure loading untuk indicator X1, X3, dan X5 untuk faktor F2 adalah:
    X1= 0,615        X3= 0,556,      X5 = -0,466
  3. Besar korelasi diantara indicator-indicator X1 dan X2, yakni:
    (0,558 x 0,604) + (0,615 x 0,748) = 0,79705
    Besar korelasi antara indikator X3 dan X4, yakni:
    (0,469 x 0,818) + (0,556 x -0,411) = 0,15513
    Besar korelasi antara indikator X5 dan X6, yakni:
    (0,866 x 0,686) + (-0,466 x -0,461) = 0.8089
    Jika analisis dilanjutkan untuk korelasi antara indikator-indikator  lain maka akan diperoleh:

Persentase dari  shared variance terkait dengan indicator –indicator  X1, X2, dan X3
Variabel F1:
X1= (0.311 ÷ 2.786) x 100% = 11.2%
X2= (0.365 ÷ 2.786) x 100% = 13.1%
X3= (0.220 ÷ 2.786) x 100% = 7.9%
Jumlah = 32,2%.
Cara lain akan memperoleh hasil yang sama (0,311+0,365+0,220)/2,786 = 0,3216 atau sekitar 32,2 %.

Variabel F2 :
X1= (0.378 ÷ 1.845) x 100% = 20.5%
X2 = (0.560 ÷ 1.845) x 100% = 30.3%
X3 = (0.309 ÷ 1.845) x 100% = 16.8%
Jumlah = 67,6%.
Cara lain akan memperoleh hasil yang sama (0,378+0,560+0,309)/1,845 = 0,6758 atau sekitar 67,6 %.

Berdasarkan hasil tersebut maka commom factor F2 lebih tepat mengukur indikator X1, X2, dan X3, jika dibandingkan dengan dengan commom factor F1. Hal ini disebabkan oleh karnea communality-communality atau shared variances dari variabel X1, X2, dan X3 dengan Faktor F2 (67,6 %.) jauh lebih besar daripada communality-communality atau shared variances dari variabel X1, X2, dan X3 dengan Faktor F1 (32,2%).

Demikian Solusi UAS Statistika Data Sains tahun 2021. Mudah-mudahan bermanfaat.

=Baca juga=
Materi Pembinaan KSN Fisika 2021

Salam Sehat
Herman

Tinggalkan Balasan

%d blogger menyukai ini: