- Rumus
- Karakteristik distribusi normal
- Interval kepercayaan
- Aplikasi distribusi normal
- Contoh
- Latihan diselesaikan
- Referensi
The distribusi normal atau distribusi Gaussian adalah distribusi probabilitas dalam variabel kontinu, di mana fungsi kepadatan probabilitas digambarkan oleh fungsi eksponensial argumen kuadrat dan negatif, yang menimbulkan bentuk lonceng.
Nama distribusi normal berasal dari fakta bahwa distribusi ini adalah yang berlaku untuk sejumlah besar situasi di mana beberapa variabel acak kontinu terlibat dalam kelompok atau populasi tertentu.
Gambar 1. Distribusi normal N (x; μ, σ) dan kepadatan probabilitasnya f (s; μ, σ). (Elaborasi sendiri)
Contoh di mana distribusi normal diterapkan adalah: tinggi pria atau wanita, variasi dalam ukuran beberapa besaran fisik atau dalam sifat psikologis atau sosiologis yang dapat diukur seperti kecerdasan intelektual atau kebiasaan konsumsi produk tertentu.
Di sisi lain, ini disebut distribusi Gaussian atau lonceng Gaussian, karena jenius matematika Jerman inilah yang dikreditkan dengan penemuannya untuk penggunaan yang dia berikan untuk menggambarkan kesalahan statistik pengukuran astronomi pada tahun 1800.
Namun, disebutkan bahwa distribusi statistik ini sebelumnya diterbitkan oleh ahli matematika hebat asal Prancis lainnya, seperti Abraham de Moivre, pada tahun 1733.
Rumus
Fungsi distribusi normal pada variabel kontinu x, dengan parameter μ dan σ, dilambangkan dengan:
N (x; μ, σ)
dan secara eksplisit tertulis seperti ini:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
di mana f (u; μ, σ) adalah fungsi kepadatan probabilitas:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
Konstanta yang mengalikan fungsi eksponensial dalam fungsi kerapatan probabilitas disebut konstanta normalisasi, dan telah dipilih sedemikian rupa sehingga:
N (+ ∞, μ, σ) = 1
Ekspresi sebelumnya memastikan bahwa probabilitas variabel acak x berada di antara -∞ dan + ∞ adalah 1, yaitu, probabilitas 100%.
Parameter μ adalah rata-rata aritmatika dari variabel acak kontinu x dan σ simpangan baku atau akar kuadrat dari varian variabel yang sama. Dalam hal μ = 0 dan σ = 1 maka kita memiliki distribusi normal standar atau distribusi normal tipikal:
N (x; μ = 0, σ = 1)
Karakteristik distribusi normal
1- Jika variabel statistik acak mengikuti distribusi normal kepadatan probabilitas f (s; μ, σ), sebagian besar data dikelompokkan di sekitar nilai rata-rata μ dan tersebar di sekitarnya sedemikian rupa sehingga tidak lebih dari ⅔ dari data berada di antara μ - σ dan μ + σ.
2- Deviasi standar σ selalu positif.
3- Bentuk fungsi kerapatan f mirip dengan lonceng, oleh karena itu fungsi ini sering disebut lonceng Gaussian atau fungsi Gaussian.
4- Dalam distribusi Gaussian, mean, median, dan modenya sama.
5- Titik belok dari fungsi kerapatan probabilitas tepat berada di μ - σ dan μ + σ.
6- Fungsi f simetris terhadap sumbu yang melewati nilai rata-ratanya μ dan memiliki nol asimtotik untuk x ⟶ + ∞ dan x ⟶ -∞.
7- Semakin tinggi nilai σ, semakin besar dispersi, noise atau jarak data di sekitar nilai mean. Dengan kata lain, semakin tinggi σ maka bentuk lonceng semakin terbuka. Di sisi lain, σ kecil menunjukkan bahwa dadu mendekati mean dan bentuk bel lebih tertutup atau runcing.
8- Fungsi distribusi N (x; μ, σ) menunjukkan probabilitas bahwa variabel acak kurang dari atau sama dengan x. Misalnya, pada Gambar 1 (di atas) probabilitas P bahwa variabel x kurang dari atau sama dengan 1,5 adalah 84% dan sesuai dengan area di bawah fungsi kepadatan probabilitas f (x; μ, σ) dari -∞ sampai x.
Interval kepercayaan
9- Jika data mengikuti distribusi normal, maka 68.26% di antaranya berada di antara μ - σ dan μ + σ.
10- 95,44% data yang mengikuti distribusi normal berada di antara μ - 2σ dan μ + 2σ.
11-99,74% data yang mengikuti distribusi normal berada di antara μ - 3σ dan μ + 3σ.
12- Jika variabel acak x mengikuti distribusi N (x; μ, σ), maka variabel tersebut
z = (x - μ) / σ mengikuti distribusi normal standar N (z; 0,1).
Mengubah variabel x ke z disebut standardisasi atau pengetikan dan sangat berguna saat menerapkan tabel distribusi standar ke data yang mengikuti distribusi normal non-standar.
Aplikasi distribusi normal
Untuk menerapkan distribusi normal perlu melalui perhitungan integral dari kepadatan probabilitas, yang dari sudut pandang analitik tidak mudah dan tidak selalu ada program komputer yang memungkinkan perhitungan numeriknya. Untuk tujuan ini, tabel nilai normalisasi atau standar digunakan, yang tidak lebih dari distribusi normal dalam kasus μ = 0 dan σ = 1.
Tabel distribusi normal standar (bagian 1/2)
Tabel distribusi normal standar (bagian 2/2)
Perlu diperhatikan bahwa tabel ini tidak menyertakan nilai negatif. Namun, dengan menggunakan sifat simetri dari fungsi kerapatan probabilitas Gaussian, nilai yang sesuai dapat diperoleh. Latihan terselesaikan yang ditunjukkan di bawah ini menunjukkan penggunaan tabel dalam kasus ini.
Contoh
Misalkan Anda memiliki sekumpulan data acak x yang mengikuti distribusi normal rata-rata 10 dan deviasi standar 2. Anda diminta menemukan probabilitas bahwa:
a) Variabel acak x kurang dari atau sama dengan 8.
b) Kurang dari atau sama dengan 10.
c) Variabel x di bawah 12.
d) Probabilitas nilai x antara 8 dan 12.
Larutan:
a) Untuk menjawab pertanyaan pertama Anda hanya perlu menghitung:
N (x; μ, σ)
Dengan x = 8, μ = 10 dan σ = 2. Kami menyadari bahwa itu adalah integral yang tidak memiliki solusi analitik dalam fungsi elementer, tetapi solusi tersebut dinyatakan sebagai fungsi dari fungsi kesalahan erf (x).
Di sisi lain, ada kemungkinan untuk menyelesaikan integral dalam bentuk numerik, yang dilakukan oleh banyak kalkulator, spreadsheet, dan program komputer seperti GeoGebra. Gambar berikut menunjukkan solusi numerik yang sesuai dengan kasus pertama:
Gambar 2. Kepadatan probabilitas f (x; μ, σ). Area yang diarsir mewakili P (x ≤ 8). (Elaborasi sendiri)
dan jawabannya adalah probabilitas x di bawah 8 adalah:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) Dalam kasus ini, kami mencoba mencari probabilitas bahwa variabel acak x berada di bawah mean, yang dalam hal ini bernilai 10. Jawabannya tidak memerlukan perhitungan apa pun, karena kita tahu bahwa separuh datanya berada di bawah rata-rata dan setengah lainnya di atas rata-rata. Oleh karena itu, jawabannya adalah:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Untuk menjawab pertanyaan ini, kita harus menghitung N (x = 12; μ = 10, σ = 2), yang dapat dilakukan dengan kalkulator yang memiliki fungsi statistik atau melalui software seperti GeoGebra:
Gambar 3. Densitas probabilitas f (x; μ, σ). Area yang diarsir mewakili P (x ≤ 12). (Elaborasi sendiri)
Jawaban bagian c dapat dilihat pada gambar 3 dan adalah:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0.8413.
d) Untuk mencari probabilitas variabel random x berada diantara 8 dan 12 kita dapat menggunakan hasil dari bagian a dan c sebagai berikut:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0.8413 - 0.1587 = 0.6826 = 68.26%.
Latihan diselesaikan
Harga rata-rata saham perusahaan adalah $ 25 dengan deviasi standar $ 4. Tentukan probabilitas bahwa:
a) Suatu tindakan memiliki biaya kurang dari $ 20.
b) Itu memiliki biaya lebih dari $ 30.
c) Harganya antara $ 20 dan $ 30.
Gunakan tabel distribusi normal standar untuk menemukan jawabannya.
Larutan:
Untuk menggunakan tabel ini, perlu untuk meneruskan ke variabel z yang dinormalisasi atau diketik:
$ 20 dalam variabel ternormalisasi sama dengan z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 dan
$ 30 dalam variabel ternormalisasi sama dengan z = ($ 30 - $ 25) / $ 4 = +5/4 = +1.25.
a) $ 20 sama dengan -1,25 dalam variabel yang dinormalisasi, tetapi tabel tersebut tidak memiliki nilai negatif, jadi kami mencari nilai +1,25 yang menghasilkan nilai 0,8944.
Jika 0,5 dikurangkan dari nilai ini, hasilnya akan menjadi luas antara 0 dan 1,25 yang, omong-omong, identik (secara simetris) dengan luas antara -1,25 dan 0. Hasil pengurangannya adalah 0,8944 - 0,5 = 0,3944 yang merupakan luas antara -1,25 dan 0.
Tetapi area dari -∞ hingga -1,25 menarik, yaitu 0,5 - 0,3944 = 0,1056. Oleh karena itu disimpulkan bahwa probabilitas saham di bawah $ 20 adalah 10.56%.
b) $ 30 dalam variabel yang diketik z adalah 1,25. Untuk nilai ini, tabel menunjukkan angka 0.8944, yang berhubungan dengan area dari -∞ hingga +1.25. Area antara +1.25 dan + ∞ adalah (1 - 0.8944) = 0.1056. Dengan kata lain, probabilitas harga saham lebih dari $ 30 adalah 10,56%.
c) Probabilitas bahwa suatu tindakan memiliki biaya antara $ 20 dan $ 30 akan dihitung sebagai berikut:
100% -10,56% - 10,56% = 78,88%
Referensi
- Statistik dan probabilitas. Distribusi normal. Diperoleh dari: projectdescartes.org
- Geogebra. Geogebra klasik, kalkulus probabilitas. Dipulihkan dari geogebra.org
- MathWorks. Distribusi Gaussian. Diperoleh dari: es.mathworks.com
- Mendenhall, W. 1981. Statistik Manajemen dan Ekonomi. 3. edisi. Grupo Editorial Iberoamérica.
- Stat Trek. Ajari diri Anda Statistik. Distribusi racun. Diperoleh dari: stattrek.com,
- Triola, M. 2012. Statistika Dasar. 11. Ed. Pendidikan Pearson.
- Universitas Vigo. Distribusi kontinu utama. Diperoleh dari: anapg.webs.uvigo.es
- Wikipedia. Distribusi normal. Diperoleh dari: es.wikipedia.org