- Bagaimana cara menghitung koefisien korelasi?
- Kovarian dan varians
- Kasus ilustratif
- Kovarian Sxy
- Simpangan baku Sx
- Simpangan baku Sy
- Koefisien korelasi r
- Penafsiran
- Regresi linier
- Contoh
- Referensi
The koefisien korelasi dalam statistik merupakan indikator yang mengukur kecenderungan dua variabel kuantitatif X dan Y memiliki linear atau hubungan proporsional antara mereka.
Secara umum pasangan variabel X dan Y adalah dua karakteristik dari populasi yang sama. Misalnya, X bisa jadi tinggi seseorang dan Y beratnya.
Gambar 1. Koefisien korelasi untuk empat pasangan data (X, Y). Sumber: F. Zapata.
Dalam hal ini, koefisien korelasi akan menunjukkan ada atau tidaknya kecenderungan ke arah hubungan proporsional antara tinggi dan berat badan dalam populasi tertentu.
Koefisien korelasi linier Pearson dilambangkan dengan huruf kecil r dan nilai minimum dan maksimumnya masing-masing adalah -1 dan +1.
Nilai r = +1 menunjukkan bahwa himpunan pasangan (X, Y) sejajar sempurna dan ketika X tumbuh, Y akan tumbuh dalam proporsi yang sama. Sebaliknya, jika terjadi bahwa r = -1, himpunan pasangan juga akan menjadi sejajar sempurna, tetapi dalam kasus ini ketika X meningkat, Y berkurang dalam proporsi yang sama.
Gambar 2. Nilai yang berbeda dari koefisien korelasi linier. Sumber: Wikimedia Commons.
Di sisi lain, nilai r = 0 menunjukkan bahwa tidak ada korelasi linier antara variabel X dan Y. Sedangkan nilai r = +0,8 menunjukkan bahwa pasangan (X, Y) cenderung mengelompok di satu sisi dan yang lain dari garis tertentu.
Rumus untuk menghitung koefisien korelasi r adalah sebagai berikut:
Bagaimana cara menghitung koefisien korelasi?
Koefisien korelasi linier adalah besaran statistik yang dibangun ke dalam kalkulator ilmiah, sebagian besar spreadsheet, dan program statistik.
Namun, akan lebih mudah untuk mengetahui bagaimana rumus yang mendefinisikannya diterapkan, dan untuk ini penghitungan terperinci akan ditampilkan, dilakukan pada kumpulan data kecil.
Dan seperti yang telah dijelaskan pada bagian sebelumnya, koefisien korelasi adalah kovariansi Sxy dibagi dengan hasil kali simpangan baku Sx untuk variabel X dan Sy untuk variabel Y.
Kovarian dan varians
Kovariansi Sxy adalah:
Sxy = / (N-1)
Di mana jumlahnya berubah dari 1 ke pasangan N data (Xi, Yi).
Untuk bagiannya, deviasi standar untuk variabel X adalah akar kuadrat dari varians kumpulan data Xi, dengan i dari 1 ke N:
Sx = √
Demikian pula, deviasi standar untuk variabel Y adalah akar kuadrat dari varians kumpulan data Yi, dengan i dari 1 ke N:
Sy = √
Kasus ilustratif
Untuk menunjukkan secara rinci bagaimana menghitung koefisien korelasi, kami akan mengambil empat pasang data berikut
(X, Y): {(1, 1); (2. 3); (3, 6) dan (4, 7)}.
Pertama kita menghitung mean aritmatika untuk X dan Y, sebagai berikut:
Kemudian parameter yang tersisa dihitung:
Kovarian Sxy
Sxy = / (4-1)
Sxy = / (3) = 10,5 / 3 = 3,5
Simpangan baku Sx
Sx = √ = √ = 1,29
Simpangan baku Sy
Sx = √ =
√ = 2.75
Koefisien korelasi r
r = 3,5 / (1,29 * 2,75) = 0,98
Penafsiran
Dalam kumpulan data kasus sebelumnya, korelasi linier yang kuat diamati antara variabel X dan Y, yang dimanifestasikan baik dalam plot pencar (ditunjukkan pada Gambar 1) dan dalam koefisien korelasi, yang menghasilkan a nilai cukup dekat dengan persatuan.
Sejauh koefisien korelasi mendekati 1 atau -1, semakin masuk akal untuk menyesuaikan data ke garis, hasil dari regresi linier.
Regresi linier
Garis regresi linier diperoleh dari metode kuadrat terkecil. di mana parameter garis regresi diperoleh dari minimalisasi jumlah kuadrat selisih antara estimasi nilai Y dan Yi dari data N.
Di sisi lain, parameter a dan b dari garis regresi y = a + bx diperoleh dengan metode kuadrat terkecil adalah:
* b = Sxy / (Sx 2 ) untuk kemiringan
* a =
Ingatlah bahwa Sxy adalah kovariansi yang ditentukan di atas dan Sx 2 adalah varian atau kuadrat deviasi standar yang ditentukan di atas.
Contoh
Koefisien korelasi digunakan untuk mengetahui apakah ada korelasi linier antara dua variabel. Hal ini berlaku jika variabel yang akan diteliti bersifat kuantitatif dan selanjutnya diasumsikan mengikuti distribusi tipe normal.
Kami memiliki contoh ilustrasi di bawah ini: ukuran derajat obesitas adalah indeks massa tubuh, yang diperoleh dengan membagi berat badan seseorang dalam kilogram dengan tinggi kuadrat orang dalam satuan meter kuadrat.
Anda ingin mengetahui apakah ada korelasi kuat antara indeks massa tubuh dan konsentrasi kolesterol HDL dalam darah, yang diukur dalam milimol per liter. Untuk itu telah dilakukan penelitian terhadap 533 orang yang dirangkum dalam grafik berikut, dimana setiap titik merepresentasikan data satu orang.
Gambar 3. Studi BMI dan kolesterol HDL pada 533 pasien. Sumber: Institut Ilmu Kesehatan Aragon (IACS).
Pengamatan yang cermat pada grafik menunjukkan bahwa ada kecenderungan linier tertentu (tidak terlalu mencolok) antara konsentrasi kolesterol HDL dan indeks massa tubuh. Ukuran kuantitatif dari tren ini adalah koefisien korelasi, yang dalam hal ini ternyata r = -0,276.
Referensi
- González C. Statistik Umum. Diperoleh dari: tarwi.lamolina.edu.pe
- IACS. Institut Ilmu Kesehatan Aragon. Diperoleh dari: ics-aragon.com
- Salazar C. dan Castillo S. Prinsip dasar statistik. (2018). Dipulihkan dari: dspace.uce.edu.ec
- Superprof. Koefisien korelasi. Diperoleh dari: superprof.es
- USAC. Manual statistik deskriptif. (2011). Diperoleh dari: statistics.ingenieria.usac.edu.gt
- Wikipedia. Koefisien korelasi Pearson. Diperoleh dari: es.wikipedia.com.