The aturan Sturges adalah kriteria yang digunakan untuk menentukan jumlah kelas atau rentang yang diperlukan untuk merencanakan satu set data statistik. Aturan ini diucapkan pada tahun 1926 oleh matematikawan Jerman Herbert Sturges.
Sturges mengusulkan metode sederhana, berdasarkan jumlah sampel x yang memungkinkan kita untuk menemukan jumlah kelas dan lebar jangkauannya. Aturan Sturges banyak digunakan, terutama di bidang statistik, khususnya untuk membangun histogram frekuensi.
Penjelasan
Aturan Sturges adalah metode empiris yang banyak digunakan dalam statistik deskriptif untuk menentukan jumlah kelas yang harus ada dalam histogram frekuensi, untuk mengklasifikasikan sekumpulan data yang mewakili sampel atau populasi.
Pada dasarnya, aturan ini menentukan lebar wadah grafik, dari histogram frekuensi.
Untuk menetapkan aturannya Herbert Sturges menganggap diagram frekuensi ideal, terdiri dari interval K, di mana interval ke-i berisi sejumlah sampel (i = 0,… k - 1), direpresentasikan sebagai:
Jumlah sampel tersebut diberikan oleh sejumlah cara di mana subset dari suatu set dapat diekstraksi; yaitu, dengan koefisien binomial, dinyatakan sebagai berikut:
Untuk menyederhanakan ekspresi, dia menerapkan properti logaritma ke kedua bagian persamaan:
Jadi, Sturges menetapkan bahwa jumlah optimal interval k diberikan oleh ekspresi:
Itu juga dapat dinyatakan sebagai:
Dalam ungkapan ini:
- k adalah jumlah kelas.
- N adalah jumlah observasi dalam sampel.
- Log adalah logaritma basis 10.
Misalnya, untuk membuat histogram frekuensi yang menyatakan sampel acak dengan tinggi 142 anak, jumlah interval atau kelas yang akan dimiliki distribusi adalah:
k = 1 + 3,322 * log 10 (N)
k = 1 + 3.322 * log (142)
k = 1 + 3,322 * 2,1523
k = 8,14 ≈ 8
Dengan demikian, pendistribusian akan dilakukan dalam 8 interval.
Jumlah interval harus selalu diwakili oleh bilangan bulat. Dalam kasus di mana nilainya adalah desimal, perkiraan harus dibuat ke bilangan bulat terdekat.
Aplikasi
Aturan Sturges diterapkan terutama dalam statistik, karena memungkinkan distribusi frekuensi dilakukan melalui penghitungan jumlah kelas (k), serta panjang masing-masing kelas, juga dikenal sebagai amplitudo.
Amplitudo adalah selisih dari batas atas dan bawah kelas, dibagi dengan jumlah kelas, dan dinyatakan:
Ada banyak aturan praktis yang memungkinkan dilakukannya distribusi frekuensi. Namun, aturan Sturges umumnya digunakan karena mendekati jumlah kelas, yang umumnya berkisar dari 5 hingga 15.
Dengan demikian, ia mempertimbangkan nilai yang secara memadai mewakili sampel atau populasi; artinya, perkiraan tidak mewakili pengelompokan ekstrem, juga tidak berfungsi dengan jumlah kelas yang berlebihan yang tidak memungkinkan sampel diringkas.
Contoh
Histogram frekuensi perlu dibuat sesuai dengan data yang diberikan, yang sesuai dengan usia yang diperoleh dalam survei terhadap pria yang berolahraga di gym setempat.
Untuk menentukan intervalnya, seseorang harus mengetahui besarnya sampel atau jumlah observasi; dalam hal ini, ada 30.
Kemudian aturan Sturges berlaku:
k = 1 + 3,322 * log 10 (N)
k = 1 + 3.322 * log (30)
k = 1 + 3,322 * 1,4771
k = 5.90 ≈ 6 interval.
Dari jumlah intervalnya, amplitudo yang dimilikinya dapat dihitung; Artinya, lebar setiap batang direpresentasikan dalam histogram frekuensi:
Batas bawah dianggap sebagai nilai terkecil dari data, dan batas atas adalah nilai terbesar. Selisih antara batas atas dan batas bawah disebut range atau range variabel (R).
Dari tabel kita mendapatkan bahwa batas atas adalah 46 dan batas bawah adalah 13; dengan demikian, amplitudo tiap kelas adalah:
Interval akan terdiri dari batas atas dan batas bawah. Untuk menentukan interval ini, kita mulai dengan menghitung dari batas bawah, menambahkan amplitudo yang ditentukan oleh aturan (6), sebagai berikut:
Kemudian frekuensi absolut dihitung untuk menentukan jumlah pria yang sesuai dengan setiap interval; dalam hal ini adalah:
- Interval 1: 13 - 18 = 9
- Interval 2:19 - 24 = 9
- Interval 3: 25 - 30 = 5
- Interval 4: 31 - 36 = 2
- Interval 5: 37 - 42 = 2
- Interval 6: 43 - 48 = 3
Saat menjumlahkan frekuensi absolut setiap kelas, ini harus sama dengan jumlah total sampel; dalam hal ini, 30.
Selanjutnya, frekuensi relatif tiap interval dihitung, membagi frekuensi absolutnya dengan jumlah total pengamatan:
- Interval 1: fi = 9 ÷ 30 = 0,30
- Interval 2: fi = 9 ÷ 30 = 0,30
- Interval 3: fi = 5 ÷ 30 = 0,1666
- Interval 4: fi = 2 ÷ 30 = 0,0666
- Interval 5: fi = 2 ÷ 30 = 0,0666
- Interval 4: fi = 3 ÷ 30 = 0,10
Kemudian Anda dapat membuat tabel yang mencerminkan data tersebut, dan juga diagram dari frekuensi relatif dalam kaitannya dengan interval yang diperoleh, seperti dapat dilihat pada gambar berikut:
Dengan cara ini, aturan Sturges memungkinkan penentuan jumlah kelas atau interval di mana sampel dapat dibagi, untuk meringkas sampel data melalui penjabaran tabel dan grafik.
Referensi
- Alfonso Urquía, MV (2013). Pemodelan Dan Simulasi Peristiwa Diskrit. UNED,.
- Altman Naomi, MK (2015). "Regresi Linear Sederhana." Metode Alam.
- Antúnez, RJ (2014). Statistik dalam pendidikan. UNIT Digital.
- Fox, J. (1997.). Analisis Regresi Terapan, Model Linear, dan Metode Terkait. SAGE Publications.
- Humberto Llinás Solano, CR (2005). Statistik deskriptif dan distribusi probabilitas. Universitas Utara.
- Panteleeva, OV (2005). Dasar-dasar Probabilitas dan Statistik.
- O. Kuehl, MO (2001). Desain Eksperimen: Prinsip Statistik Desain dan Analisis Penelitian. Editor Thomson.