Tendensi Pusat vs Dispersi
Dalam statistik deskriptif dan inferensial, beberapa indeks digunakan untuk menggambarkan kumpulan data yang sesuai dengan tendensi sentral, dispersi, dan kemiringannya: tiga properti terpenting yang menentukan bentuk relatif dari distribusi kumpulan data.
Apakah tendensi sentral itu?
Tendensi sentral mengacu pada dan menempatkan pusat distribusi nilai. Mean, mode, dan median adalah indeks yang paling umum digunakan dalam menggambarkan tendensi sentral dari suatu kumpulan data. Jika suatu kumpulan data simetris, maka median dan mean dari kumpulan data tersebut bertepatan satu sama lain.
Mengingat kumpulan data, rata-rata dihitung dengan menjumlahkan semua nilai data dan kemudian membaginya dengan jumlah data. Misalnya, berat 10 orang (dalam kilogram) diukur menjadi 70, 62, 65, 72, 80, 70, 63, 72, 77 dan 79. Maka berat rata-rata sepuluh orang (dalam kilogram) dapat dihitung sebagai berikut. Jumlah bobotnya adalah 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Rata-rata=(jumlah) / (jumlah data)=710 / 10=71 (dalam kilogram). Dapat dipahami bahwa outlier (titik data yang menyimpang dari tren normal) cenderung mempengaruhi mean. Dengan demikian, dengan adanya outlier berarti saja tidak akan memberikan gambaran yang benar tentang pusat kumpulan data.
Median adalah titik data yang ditemukan tepat di tengah kumpulan data. Salah satu cara untuk menghitung median adalah dengan mengurutkan titik data dalam urutan menaik, dan kemudian menemukan titik data di tengah. Misalnya, jika sekali diurutkan, kumpulan data sebelumnya terlihat seperti, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Oleh karena itu, (70+72)/2=71 berada di tengah. Dari sini terlihat bahwa median tidak perlu ada dalam kumpulan data. Median tidak terpengaruh oleh adanya outlier. Oleh karena itu, median akan berfungsi sebagai ukuran tendensi sentral yang lebih baik dengan adanya outlier.
Mode adalah nilai yang paling sering muncul dalam kumpulan data. Pada contoh sebelumnya, nilai 70 dan 72 keduanya muncul dua kali dan dengan demikian, keduanya adalah mode. Hal ini menunjukkan bahwa pada beberapa distribusi terdapat lebih dari satu nilai modal. Jika hanya ada satu mode, kumpulan data dikatakan unimodal, dalam hal ini kumpulan data adalah bimodal.
Apa itu dispersi?
Dispersi adalah jumlah penyebaran data tentang pusat distribusi. Rentang dan simpangan baku adalah ukuran dispersi yang paling umum digunakan.
Rentang hanyalah nilai tertinggi dikurangi nilai terendah. Pada contoh sebelumnya, nilai tertinggi adalah 80 dan nilai terendah adalah 62, sehingga rentangnya adalah 80-62=18. Namun rentang tidak memberikan gambaran yang cukup tentang dispersi.
Untuk menghitung simpangan baku, pertama-tama simpangan nilai data dari rata-rata dihitung. Rata-rata akar kuadrat dari deviasi disebut deviasi standar. Pada contoh sebelumnya, masing-masing deviasi dari mean adalah (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 dan (79 – 71)=8. Jumlah kuadrat deviasinya adalah (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Standar deviasinya adalah (366/10)=6,05 (dalam kilogram). Kecuali jika kumpulan data sangat miring, dari sini dapat disimpulkan bahwa sebagian besar data berada dalam interval 71±6.05, dan memang demikian dalam contoh khusus ini.
Apa perbedaan tendensi sentral dan dispersi?
• Tendensi sentral merujuk dan menempatkan pusat distribusi nilai
• Dispersi adalah jumlah penyebaran data tentang pusat kumpulan data.