- Rumus dan persamaan
- Variabel statistik penting
- Model dan properti
- Properti utama dari distribusi hipergeometrik
- Perkiraan menggunakan distribusi binomial
- Contoh 2
- Latihan terselesaikan
- Latihan 1
- Larutan
- Latihan 2
- Larutan
- Latihan 3
- Solusi untuk
- Solusi c
- Referensi
The distribusi hipergeometrik adalah fungsi statistik diskrit, cocok untuk menghitung probabilitas dalam percobaan acak kelompok dengan dua hasil yang mungkin. Syarat yang diperlukan untuk menerapkannya adalah populasi mereka kecil, di mana penarikan tidak diganti dan probabilitas tidak konstan.
Oleh karena itu, ketika suatu elemen populasi dipilih untuk mengetahui hasil (benar atau salah) dari suatu karakteristik tertentu, elemen yang sama tersebut tidak dapat dipilih lagi.
Gambar 1. Dalam populasi baut seperti ini, pasti ada spesimen yang cacat. Sumber: Pixabay.
Tentunya, elemen yang dipilih selanjutnya lebih mungkin untuk mendapatkan hasil yang benar, jika elemen sebelumnya memiliki hasil yang negatif. Ini berarti probabilitas bervariasi saat elemen diekstraksi dari sampel.
Aplikasi utama dari distribusi hipergeometri adalah: kontrol kualitas dalam proses dengan populasi kecil dan perhitungan probabilitas dalam permainan untung-untungan.
Adapun fungsi matematika yang mendefinisikan distribusi hipergeometrik terdiri dari tiga parameter, yaitu:
- Jumlah elemen populasi (N)
- Ukuran sampel (m)
- Jumlah kejadian di seluruh populasi dengan hasil yang menguntungkan (atau tidak menguntungkan) dari karakteristik yang dipelajari (n).
Rumus dan persamaan
Rumus untuk distribusi hipergeometrik memberikan probabilitas P bahwa x kasus yang menguntungkan dari karakteristik tertentu terjadi. Cara penulisannya secara matematis berdasarkan bilangan kombinatorial adalah:
Pada ekspresi sebelumnya N, n dan m adalah parameter dan x adalah variabel itu sendiri.
- Jumlah penduduk N.
-Jumlah hasil positif dari karakteristik biner tertentu terhadap total populasi adalah n.
-Jumlah elemen dalam sampel adalah m.
Dalam hal ini, X adalah variabel acak yang mengambil nilai x dan P (x) menunjukkan probabilitas kemunculan x kasus yang menguntungkan dari karakteristik yang diteliti.
Variabel statistik penting
Variabel statistik lain untuk distribusi hipergeometrik adalah:
- Berarti μ = m * n / N
- Varians σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Simpangan baku σ yang merupakan akar kuadrat dari varians.
Model dan properti
Untuk sampai pada model distribusi hipergeometrik, kita mulai dari kemungkinan mendapatkan x kasus yang menguntungkan dalam sampel berukuran m. Sampel ini berisi elemen yang sesuai dengan properti yang diteliti dan elemen yang tidak sesuai.
Ingatlah bahwa n mewakili jumlah kasus yang menguntungkan dalam populasi total elemen N. Kemudian probabilitas akan dihitung seperti ini:
Mengekspresikan di atas dalam bentuk bilangan kombinatorial, model distribusi probabilitas berikut tercapai:
Properti utama dari distribusi hipergeometrik
Mereka adalah sebagai berikut:
- Sampel harus selalu kecil, meskipun populasinya besar.
- Unsur-unsur sampel diekstraksi satu per satu, tanpa memasukkannya kembali ke dalam populasi.
- Properti yang akan dipelajari adalah biner, yaitu hanya dapat mengambil dua nilai: 1 atau 0, atau benar atau salah.
Dalam setiap langkah ekstraksi elemen, probabilitas berubah tergantung pada hasil sebelumnya.
Perkiraan menggunakan distribusi binomial
Sifat lain dari distribusi hipergeometrik adalah dapat didekati dengan distribusi binomial, dilambangkan dengan Bi, selama populasi N besar dan setidaknya 10 kali lebih besar dari sampel m. Dalam hal ini akan terlihat seperti ini:
Probabilitas bahwa x = 3 sekrup dalam sampel rusak adalah: P (500, 5, 60, 3) = 0,0129.
Untuk bagiannya, probabilitas bahwa x = 4 sekrup dari enam puluh sampel rusak adalah: P (500, 5, 60; 4) = 0,0008.
Akhirnya, probabilitas bahwa x = 5 sekrup dalam sampel tersebut rusak adalah: P (500, 5, 60; 5) = 0.
Tetapi jika Anda ingin mengetahui probabilitas bahwa dalam sampel tersebut terdapat lebih dari 3 sekrup yang rusak, maka Anda harus mendapatkan probabilitas kumulatif, dengan menambahkan:
Contoh ini diilustrasikan pada gambar 2, diperoleh dengan menggunakan GeoGebra, perangkat lunak gratis yang banyak digunakan di sekolah, institut, dan universitas.
Gambar 2. Contoh distribusi hipergeometrik. Disiapkan oleh F. Zapata dengan GeoGebra.
Contoh 2
Dek dek Spanyol memiliki 40 kartu, 10 di antaranya memiliki emas dan 30 sisanya tidak. Misalkan 7 kartu diambil secara acak dari dek itu, yang tidak digabungkan kembali ke dalam dek.
Jika X adalah jumlah emas yang ada dalam 7 kartu yang diambil, maka kemungkinan memiliki x emas dalam undian 7 kartu diberikan oleh distribusi hipergeometrik P (40,10,7; x).
Mari kita lihat seperti ini: untuk menghitung probabilitas memiliki 4 emas dalam undian 7 kartu, kita menggunakan rumus distribusi hipergeometrik dengan nilai berikut:
Dan hasilnya adalah: probabilitas 4,57%.
Tetapi jika Anda ingin mengetahui kemungkinan mendapatkan lebih dari 4 kartu, maka Anda harus menambahkan:
Latihan terselesaikan
Serangkaian latihan berikut dimaksudkan untuk mengilustrasikan dan mengasimilasi konsep yang telah disajikan dalam artikel ini. Penting bagi pembaca untuk mencoba menyelesaikannya sendiri, sebelum melihat solusinya.
Latihan 1
Sebuah pabrik kondom telah menemukan bahwa dari setiap 1000 kondom yang diproduksi oleh mesin tertentu, 5 rusak. Untuk kontrol kualitas, 100 kondom diambil secara acak dan lot ditolak jika ada setidaknya satu atau lebih kondom yang rusak. Menjawab:
a) Bagaimana kemungkinan bahwa banyak dari 100 akan dibuang?
b) Apakah kriteria kendali mutu ini efisien?
Larutan
Dalam hal ini, bilangan kombinatorial yang sangat besar akan muncul. Perhitungannya sulit, kecuali Anda memiliki paket perangkat lunak yang sesuai.
Tetapi karena ini adalah populasi yang besar dan sampelnya sepuluh kali lebih kecil dari total populasi, maka dimungkinkan untuk menggunakan perkiraan distribusi hipergeometrik dengan distribusi binomial:
Dalam ekspresi di atas C (100, x) adalah bilangan kombinatorial. Maka probabilitas memiliki lebih dari satu cacat akan dihitung seperti ini:
Ini adalah perkiraan yang sangat baik, jika dibandingkan dengan nilai yang diperoleh dengan menerapkan distribusi hipergeometrik: 0,4102
Dapat dikatakan bahwa, dengan probabilitas 40%, sekumpulan 100 profilaksis harus dibuang, yang tidak terlalu efisien.
Namun, karena tuntutan yang sedikit lebih ringan dalam proses kendali mutu dan membuang lot 100 hanya jika ada dua atau lebih cacat, maka kemungkinan membuang lot akan turun menjadi hanya 8%.
Latihan 2
Mesin balok plastik bekerja sedemikian rupa sehingga dari setiap 10 buah, satu keluar cacat. Dalam sampel yang terdiri dari 5 buah, seberapa besar kemungkinan hanya satu buah yang rusak?
Larutan
Populasi: N = 10
Jumlah n barang cacat setiap N: n = 1
Ukuran sampel: m = 5
Oleh karena itu ada kemungkinan 50% bahwa dalam sampel 5, sebuah blok akan berubah bentuk.
Latihan 3
Dalam pertemuan pemuda lulusan SMA ada 7 bapak ibu dan 6 bapak-bapak. Di antara gadis-gadis itu, 4 belajar humaniora dan 3 sains. Di boy group, 1 orang mempelajari humaniora dan 5 ilmu. Hitung yang berikut:
a) Memilih tiga gadis secara acak: seberapa besar kemungkinan mereka semua mempelajari humaniora?
b) Jika tiga peserta pertemuan teman dipilih secara acak: Bagaimana kemungkinan mereka bertiga, terlepas dari jenis kelamin, mempelajari ilmu ketiganya, atau humaniora juga ketiganya?
c) Sekarang pilih dua teman secara acak dan panggil x variabel acak "jumlah orang yang belajar humaniora". Di antara dua yang dipilih, tentukan nilai mean atau nilai yang diharapkan dari x dan varians σ ^ 2.
Solusi untuk
Nilai yang digunakan sekarang adalah:
-Populasi: N = 14
-Jumlah yang mempelajari huruf adalah: n = 6 dan
-Ukuran sampel: m = 3.
-Jumlah teman belajar humaniora: x
Menurutnya, x = 3 berarti ketiganya mempelajari humaniora, tetapi x = 0 berarti tidak ada yang mempelajari humaniora. Probabilitas bahwa ketiganya mempelajari hal yang sama diberikan oleh penjumlahan:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Kemudian kami memiliki 21% probabilitas bahwa tiga peserta rapat, yang dipilih secara acak, akan mempelajari hal yang sama.
Solusi c
Di sini kami memiliki nilai-nilai berikut:
N = 14 total populasi teman, n = 6 jumlah populasi yang mempelajari ilmu humaniora, ukuran sampel adalah m = 2.
Harapan adalah:
E (x) = m * (n / N) = 2 * (6/14) = 0.8572
Dan variansnya:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Referensi
- Distribusi probabilitas diskrit. Diperoleh dari: biplot.usal.es
- Statistik dan probabilitas. Distribusi hipergeometrik. Diperoleh dari: projectdescartes.org
- CDPYE-UGR. Distribusi hipergeometrik. Diperoleh dari: ugr.es
- Geogebra. Geogebra klasik, kalkulus probabilitas. Dipulihkan dari geogebra.org
- Coba mudah. Memecahkan masalah distribusi hipergeometrik. Diperoleh dari: probafacil.com
- Minitab. Distribusi hipergeometrik. Diperoleh dari: support.minitab.com
- Universitas Vigo. Distribusi diskrit utama. Diperoleh dari: anapg.webs.uvigo.es
- Vitutor. Statistik dan kombinatorik. Diperoleh dari: vitutor.net
- Weisstein, Eric W. Distribusi Hipergeometrik. Diperoleh dari: mathworld.wolfram.com
- Wikipedia. Distribusi hipergeometrik. Diperoleh dari: es.wikipedia.com