- Contoh
- Klasifikasi variabel kategori
- Kategori nominal
- Kategorikal ordinal
- Kategori biner
- Statistik dengan variabel kategori
- Representasi grafis dari variabel kategori
- Latihan terselesaikan
- Latihan 1
- Contoh 2
- Contoh 3
- Referensi
The variabel kategoris adalah salah satu yang digunakan dalam statistik untuk menetapkan karakteristik non-numerik atau kualitatif atau properti ke beberapa objek, individu, badan, kondisi atau prosedur. Dimungkinkan untuk mendefinisikan semua jenis variabel kategori sesuai dengan kebutuhan masing-masing.
Contoh variabel kategori adalah: warna kulit, jenis kelamin, golongan darah, status perkawinan, jenis bahan, bentuk pembayaran atau jenis rekening bank, dan banyak digunakan setiap hari.
Gambar 1: Warna adalah variabel kategorikal. Sumber: pixabay
Di atas adalah variabel, tetapi kemungkinan nilainya adalah kualitatif, yaitu kualitas atau karakteristik dan bukan dari pengukuran numerik. Misalnya, nilai yang mungkin untuk variabel jenis kelamin adalah: male, h embra.
Ketika variabel ini disimpan dalam program komputer, itu dapat dideklarasikan sebagai variabel teks dan satu-satunya nilai yang diterima adalah yang sudah dinamai: Pria, Wanita.
Namun, jenis kelamin variabel yang sama dapat dideklarasikan dan disimpan sebagai bilangan bulat jika Pria diberi nilai 1 dan Wanita diberi nilai 2. Karena alasan inilah variabel kategori kadang-kadang disebut sebagai tipe enumerasi.
Karakteristik utama dari variabel kategorikal adalah bahwa tidak seperti variabel lain, seperti variabel kontinu dan diskrit, tidak mungkin untuk melakukan aritmatika dengannya. Namun, statistik dapat dilakukan dengannya, seperti yang akan kita lihat nanti.
Contoh
Perhatikan contoh variabel kategori berikut dan kemungkinan nilainya:
- Group_Sanguíneo, Rentang nilai: A, B, AB, O
- Civil_Status, Categorical Values: Single (A), Menikah (B), Janda (C), Cerai (D).
- Tipo_de_Material, Kategori atau nilai: 1 = Kayu, 2 = Logam, 3 = Plastik
-Form_of_Payment, Securities atau kategori: (1) Cash, (2) Debit, (3) Transfer, (4) Credit
Dalam contoh sebelumnya, angka telah dikaitkan dengan setiap kategori dengan cara yang sepenuhnya berubah-ubah.
Kemudian dapat dianggap bahwa asosiasi numerik sewenang-wenang ini membuatnya setara dengan variabel kuantitatif diskrit, tetapi sebenarnya tidak, karena operasi aritmatika tidak dapat dilakukan dengan angka-angka ini.
Untuk mengilustrasikan ide, dalam variabel Form_of_Payment, operasi penjumlahan tidak masuk akal:
(1) Tunai + (2) Debit tidak akan pernah sama (3) Transfer
Klasifikasi variabel kategori
Pemeringkatan didasarkan pada apakah mereka memiliki hierarki implisit atau tidak atau apakah jumlah kemungkinan hasil lebih dari dua atau dua.
Variabel kategoris dengan hanya satu kemungkinan hasil bukanlah variabel, itu adalah konstanta kategoris.
Kategori nominal
Ketika mereka tidak dapat diwakili oleh angka atau memiliki urutan apa pun. Misalnya, variabel: Type_of_Material, memiliki nilai nominal (Kayu, Logam, Plastik), variabel tersebut tidak memiliki hierarki atau urutan, bahkan jika nomor sembarang ditetapkan untuk setiap respons atau kategori.
Kategorikal ordinal
Variabel: Academic_performance
Nilai nominal: Tinggi, Sedang, Rendah
Meskipun nilai variabel ini bukan numerik, mereka memiliki urutan atau hierarki implisit.
Kategori biner
Ini adalah variabel nominal dengan dua kemungkinan jawaban, misalnya:
-Variabel: Respon
-Nilai nominal: Benar, Salah
Perhatikan bahwa variabel Respon tidak memiliki hierarki implisit dan hanya memiliki dua kemungkinan hasil, jadi ini adalah variabel kategorikal biner.
Beberapa penulis menyebut tipe ini sebagai variabel biner, dan tidak menganggapnya termasuk dalam variabel kategori yang dibatasi untuk variabel dengan lebih dari tiga kategori yang memungkinkan.
Statistik dengan variabel kategori
Statistik dapat dilakukan dengan variabel kategori, meskipun bukan variabel numerik atau kuantitatif. Misalnya, untuk mengetahui tren atau nilai yang paling mungkin dari variabel kategorikal, modenya diambil.
Modusnya, dalam hal ini, hasil atau nilai yang paling sering diulang dari variabel kategorikal. Untuk variabel kategori, tidak mungkin menghitung mean atau median.
Rata-rata tidak dapat dihitung karena Anda tidak dapat melakukan aritmatika dengan variabel kategori. Begitu pula mediannya, karena variabel kuantitatif atau kategorikal tidak memiliki urutan atau hierarki, sehingga tidak memungkinkan untuk menentukan nilai sentral.
Representasi grafis dari variabel kategori
Mengingat variabel kategori tertentu, frekuensi atau berapa kali hasil variabel tersebut diulang dapat ditemukan. Jika ini dilakukan untuk setiap hasil, maka grafik frekuensi terhadap setiap kategori atau hasil dapat dibuat.
Berikut adalah beberapa contoh bagaimana variabel kategori dapat direpresentasikan secara grafis.
Latihan terselesaikan
Latihan 1
Sebuah perusahaan memiliki pencatatan data sebanyak 170 karyawan. Salah satu variabel yang ada di catatan ini adalah: Estado_Civil. Variabel ini memiliki empat kategori atau kemungkinan nilai:
Lajang (A), Menikah (B), Janda (C), Cerai (D).
Meskipun merupakan variabel non-numerik, dimungkinkan untuk mengetahui berapa banyak dari total record yang berada dalam kategori tertentu dan direpresentasikan dalam bentuk grafik batang, seperti yang ditunjukkan pada gambar berikut:
Gambar 2. Representasi hasil variabel kategori. Sumber: buatan sendiri
Contoh 2
Sebuah toko sepatu mencatat penjualannya. Di antara variabel yang mengelola catatannya adalah warna sepatu untuk setiap model. Variabel:
Color_Shoe_Model_AW3
Ini adalah tipe kategorikal dan memiliki lima kategori atau nilai yang mungkin. Untuk setiap kategori variabel ini jumlah penjualan dijumlahkan dan persentasenya ditetapkan. Hasilnya disajikan dalam grafik gambar berikut:
Gambar 3. Variabel kategori Color _Shoe. Dalam variabel ini mode adalah Putih. Sumber: buatan sendiri.
Maka bisa dikatakan bahwa dari model sepatu AW3 yang sedang fashion, yang paling banyak terjual adalah Putih, disusul dengan Hitam.
Dapat juga dikatakan bahwa dengan probabilitas 70%, sepatu berikutnya yang terjual model ini adalah Putih atau Hitam.
Informasi ini dapat berguna untuk toko saat melakukan pemesanan baru, atau bahkan dapat menerapkan diskon untuk warna yang paling sedikit terjual karena persediaan berlebih.
Contoh 3
Untuk populasi pendonor darah tertentu, Anda ingin mewakili jumlah orang yang termasuk dalam golongan darah tertentu. Cara grafik untuk memvisualisasikan hasil adalah dengan menggunakan piktogram, yang ada di bagian bawah tabel.
Kolom pertama mewakili variabel group_sanguíneo dan kemungkinan hasil atau kategorinya. Kolom kedua memiliki representasi dalam bentuk ikonik atau bergambar jumlah orang di setiap kategori. Dalam contoh kami, tetesan merah digunakan sebagai ikon, yang masing-masing mewakili 10 orang.
Gambar 4. Piktogram. Sumber: buatan sendiri
Referensi
- Khan Academy. Menganalisis data kategorikal. Diperoleh dari: khanacademy.org
- Rumus alam semesta. Variabel kualitatif. Dipulihkan dari: univesoformulas.com
- Minitab. Yang merupakan variabel kategori, diskrit dan kontinu. Diperoleh dari: support.minitab.com
- Tutorial Excel. Karakterisasi variabel. Diperoleh dari: help.xlslat.com.
- Wikipedia. Variabel Statistik. Dipulihkan dari wikipedia.com
- Wikipedia. Variabel kategori. Dipulihkan dari wikipedia.com
- Wikipedia. Variabel Kategorikal. Dipulihkan dari wikipedia.com