- Jenis derajat kebebasan
- Dalam kasus mekanis
- Dalam satu set nilai acak
- Contoh
- Varians dan derajat kebebasan
- Dalam distribusi Chi kuadrat
- Dalam uji hipotesis (Dengan contoh terselesaikan)
- Referensi
The derajat kebebasan dalam statistik adalah jumlah komponen independen dari vektor acak. Jika vektor memiliki n komponen dan terdapat persamaan linier p yang berkaitan dengan komponennya, maka derajat kebebasannya adalah np.
Konsep derajat kebebasan juga muncul dalam mekanika teoritis, yang secara kasar setara dengan dimensi ruang tempat partikel bergerak, dikurangi jumlah ikatan.
Gambar 1. Sebuah bandul bergerak dalam dua dimensi, namun hanya memiliki satu derajat kebebasan karena dipaksa bergerak dalam radius lengkung L. Sumber: F. Zapata.
Artikel ini akan membahas konsep derajat kebebasan yang diterapkan pada statistik, tetapi contoh mekanis lebih mudah divisualisasikan dalam bentuk geometris.
Jenis derajat kebebasan
Bergantung pada konteks di mana itu diterapkan, cara menghitung jumlah derajat kebebasan dapat bervariasi, tetapi gagasan yang mendasarinya selalu sama: dimensi total dikurangi jumlah batasan.
Dalam kasus mekanis
Mari kita pertimbangkan sebuah partikel berosilasi yang diikat ke tali (pendulum) yang bergerak dalam bidang xy vertikal (2 dimensi). Namun, partikel tersebut dipaksa untuk bergerak pada keliling jari-jari yang sama dengan panjang tali busur.
Karena partikel hanya dapat bergerak pada kurva tersebut, maka derajat kebebasannya adalah 1. Hal ini dapat dilihat pada gambar 1.
Cara menghitung besar derajat kebebasan adalah dengan mengambil selisih jumlah dimensi dikurangi jumlah pembatas:
derajat kebebasan: = 2 (dimensi) - 1 (ligatur) = 1
Penjelasan lain yang memungkinkan kita sampai pada hasil adalah sebagai berikut:
-Kita tahu bahwa posisi dalam dua dimensi diwakili oleh titik koordinat (x, y).
-Tetapi karena titik harus sesuai dengan persamaan keliling (x 2 + y 2 = L 2 ) untuk nilai tertentu dari variabel x, variabel y ditentukan oleh persamaan atau batasan tersebut.
Dengan cara ini, hanya satu variabel yang independen dan sistem memiliki satu (1) derajat kebebasan.
Dalam satu set nilai acak
Untuk mengilustrasikan apa arti konsep tersebut, misalkan vektor
x = (x 1 , x 2 ,…, x n )
Mewakili sampel dari n nilai acak terdistribusi normal. Dalam hal ini vektor acak x memiliki n komponen bebas dan oleh karena itu x dikatakan memiliki n derajat kebebasan.
Mari kita sekarang membangun vektor r dari residu
r = (x 1 -
Dimana
Jadi jumlahnya
(x 1 -
Ini adalah persamaan yang merepresentasikan batasan (atau pengikatan) dalam elemen vektor r residu, karena jika n-1 komponen vektor r diketahui , persamaan restriksi menentukan komponen yang tidak diketahui.
Oleh karena itu vektor r dimensi n dengan batasan:
∑ (x i -
Ia memiliki (n - 1) derajat kebebasan.
Sekali lagi diterapkan bahwa perhitungan jumlah derajat kebebasan adalah:
derajat kebebasan: = n (dimensi) - 1 (kendala) = n-1
Contoh
Varians dan derajat kebebasan
Varians s 2 didefinisikan sebagai mean dari kuadrat deviasi (atau residual) dari sampel n data:
s 2 = ( r • r ) / (n-1)
di mana r adalah vektor dari residu r = (x1 -
s 2 = ∑ (x i -
Bagaimanapun, perlu dicatat bahwa ketika menghitung rata-rata kuadrat residu, ia dibagi dengan (n-1) dan bukan dengan n, karena seperti yang dibahas di bagian sebelumnya, jumlah derajat kebebasan vektor r adalah ( n-1).
Jika untuk perhitungan varians dibagi dengan n bukan (n-1), hasilnya akan memiliki bias yang sangat signifikan untuk nilai n kurang dari 50.
Dalam literatur, rumus varians juga muncul dengan pembagi n, bukan (n-1), dalam hal varians suatu populasi.
Tetapi himpunan variabel acak dari residual, yang direpresentasikan oleh vektor r , meskipun memiliki dimensi n, hanya memiliki (n-1) derajat kebebasan. Namun, jika jumlah datanya cukup besar (n> 500), kedua rumus tersebut akan bertemu dengan hasil yang sama.
Kalkulator dan spreadsheet menyediakan versi varian dan deviasi standar (yang merupakan akar kuadrat dari varian).
Rekomendasi kami, mengingat analisis yang disajikan di sini, adalah selalu memilih versi dengan (n-1) setiap kali varian atau deviasi standar perlu dihitung, untuk menghindari hasil yang bias.
Dalam distribusi Chi kuadrat
Beberapa distribusi probabilitas dalam variabel acak kontinu bergantung pada parameter yang disebut derajat kebebasan, ini adalah kasus distribusi Chi kuadrat (χ 2 ).
Nama parameter ini tepat berasal dari derajat kebebasan vektor acak yang mendasari yang diterapkan distribusi ini.
Misalkan kita memiliki g populasi, dari mana sampel berukuran n diambil:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
A populasi j yang memiliki mean
Variabel standar atau dinormalisasi zj i didefinisikan sebagai:
zj i = (xj i -
Dan vektor Zj didefinisikan seperti ini:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) dan mengikuti distribusi normal standar N (0,1).
Jadi variabelnya:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
mengikuti distribusi χ 2 (g) yang disebut distribusi chi-kuadrat dengan derajat kebebasan g.
Dalam uji hipotesis (Dengan contoh terselesaikan)
Jika Anda ingin menguji hipotesis berdasarkan kumpulan data acak tertentu, Anda perlu mengetahui nilai derajat kebebasan g untuk menerapkan uji Chi-square.
Gambar 2. Adakah hubungan antara rasa rasa es krim dengan GENDER pelanggan? Sumber: F. Zapata.
Sebagai contoh, data yang dikumpulkan tentang preferensi cokelat atau es krim stroberi antara pria dan wanita di ruang tamu es krim tertentu akan dianalisis. Frekuensi pria dan wanita memilih stroberi atau cokelat dirangkum dalam Gambar 2.
Pertama, dihitung tabel frekuensi yang diharapkan, yang disiapkan dengan mengalikan total baris dengan total kolom, dibagi dengan total data. Hasilnya ditunjukkan pada gambar berikut:
Gambar 3. Perhitungan frekuensi yang diharapkan berdasarkan frekuensi yang diamati (nilai berwarna biru pada gambar 2). Sumber: F. Zapata.
Kemudian dihitung Chi kuadrat (dari data tersebut) menggunakan rumus berikut:
χ 2 = ∑ (F o - F e ) 2 / F e
Dimana F o adalah frekuensi yang diamati (Gambar 2) dan F e adalah frekuensi yang diharapkan (Gambar 3). Penjumlahan dilakukan pada semua baris dan kolom, yang dalam contoh kita memberikan empat suku.
Setelah melakukan operasi, Anda mendapatkan:
χ 2 = 0,2043.
Sekarang perlu membandingkan dengan kuadrat Chi teoretis, yang bergantung pada jumlah derajat kebebasan g.
Dalam kasus kami, angka ini ditentukan sebagai berikut:
g = (# baris - 1) (#kolom - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ternyata nilai derajat kebebasan g dalam contoh ini adalah 1.
Jika ingin memeriksa atau menolak hipotesis nol (H0: tidak ada korelasi antara TASTE dan GENDER) dengan tingkat signifikansi 1%, nilai Chi-square teoritis dihitung dengan derajat kebebasan g = 1.
Nilai yang dicari membuat frekuensi terakumulasi (1 - 0,01) = 0,99, yaitu 99%. Nilai ini (yang dapat diperoleh dari tabel) adalah 6.636.
Karena Chi teoritis melebihi yang dihitung, maka hipotesis nol diverifikasi.
Dengan kata lain, dengan data yang dikumpulkan, tidak ada hubungan yang diamati antara variabel TASTE dan GENDER.
Referensi
- Minitab. Berapa derajat kebebasannya? Diperoleh dari: support.minitab.com.
- Moore, David. (2009) Statistik terapan dasar. Editor Antoni Bosch.
- Leigh, Jennifer. Bagaimana menghitung derajat kebebasan dalam model statistik. Diperoleh dari: geniolandia.com
- Wikipedia. Derajat kebebasan (statistik). Diperoleh dari: es.wikipedia.com
- Wikipedia. Derajat kebebasan (fisik). Diperoleh dari: es.wikipedia.com