Populasi vs Contoh Deviasi Standar
Dalam statistik, beberapa indeks digunakan untuk menggambarkan kumpulan data yang sesuai dengan tendensi sentral, dispersi, dan kemiringannya. Simpangan baku adalah salah satu ukuran penyebaran data yang paling umum dari pusat kumpulan data.
Karena kesulitan praktis, tidak mungkin menggunakan data dari seluruh populasi ketika hipotesis diuji. Oleh karena itu, kami menggunakan nilai data dari sampel untuk membuat kesimpulan tentang populasi. Dalam situasi seperti ini, ini disebut estimator karena mereka memperkirakan nilai parameter populasi.
Sangat penting untuk menggunakan estimator tak bias dalam inferensi. Suatu estimator dikatakan tidak bias jika nilai ekspektasi dari estimator tersebut sama dengan parameter populasinya. Sebagai contoh, kita menggunakan mean sampel sebagai penduga tak bias untuk mean populasi. (Secara matematis, dapat ditunjukkan bahwa nilai rata-rata sampel yang diharapkan sama dengan rata-rata populasi). Dalam hal menaksir simpangan baku populasi, simpangan baku sampel juga merupakan penaksir tak bias.
Apa itu simpangan baku populasi?
Bila data dari seluruh populasi dapat diperhitungkan (misalnya dalam kasus sensus) dimungkinkan untuk menghitung simpangan baku populasi. Untuk menghitung simpangan baku populasi, terlebih dahulu dihitung simpangan nilai data dari rata-rata populasi. Akar rata-rata kuadrat (rata-rata kuadrat) dari deviasi disebut deviasi standar populasi.
Dalam kelas yang terdiri dari 10 siswa, data tentang siswa dapat dengan mudah dikumpulkan. Jika hipotesis diuji pada populasi siswa ini, maka tidak perlu menggunakan nilai sampel. Misalnya berat badan 10 siswa (dalam kilogram) diukur menjadi 70, 62, 65, 72, 80, 70, 63, 72, 77 dan 79. Maka berat rata-rata kesepuluh orang tersebut (dalam kilogram) adalah (70+62+65+72+80+70+63+72+77+79)/10, yaitu 71 (dalam kilogram). Ini adalah rata-rata populasi.
Sekarang untuk menghitung simpangan baku populasi, kita menghitung simpangan dari rata-rata. Penyimpangan masing-masing dari mean adalah (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 dan (79 – 71)=8. Jumlah kuadrat simpangan adalah (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Simpangan baku populasi adalah (366/10)=6,05 (dalam kilogram). 71 adalah berat badan rata-rata yang tepat dari siswa kelas dan 6.05 adalah standar deviasi yang tepat dari berat dari 71.
Apa yang dimaksud dengan simpangan baku sampel?
Ketika data dari sampel (berukuran n) digunakan untuk memperkirakan parameter populasi, simpangan baku sampel dihitung. Pertama, penyimpangan nilai data dari rata-rata sampel dihitung. Karena mean sampel digunakan sebagai pengganti mean populasi (yang tidak diketahui), mengambil mean kuadrat tidak tepat. Untuk mengimbangi penggunaan mean sampel, jumlah kuadrat deviasi dibagi dengan (n-1) dan bukan n. Standar deviasi sampel adalah akar kuadrat dari ini. Dalam simbol matematika, S=√{∑(xi-ẍ)2 / (n-1)}, di mana S adalah simpangan baku sampel, adalah mean sampel dan xi adalah titik data.
Sekarang asumsikan bahwa, pada contoh sebelumnya, populasinya adalah siswa dari seluruh sekolah. Kemudian, kelas hanya akan menjadi sampel. Jika sampel ini digunakan dalam estimasi, simpangan baku sampel akan menjadi (366/9)=6.38 (dalam kilogram) karena 366 dibagi 9 bukannya 10 (ukuran sampel). Fakta untuk diamati adalah bahwa ini tidak dijamin menjadi nilai standar deviasi populasi yang tepat. Itu hanya perkiraan saja.
Apa perbedaan antara simpangan baku populasi dan simpangan baku sampel?
• Simpangan baku populasi adalah nilai parameter eksak yang digunakan untuk mengukur dispersi dari pusat, sedangkan simpangan baku sampel adalah penduga tak bias untuk itu.
• Standar deviasi populasi dihitung ketika semua data mengenai setiap individu dari populasi diketahui. Jika tidak, simpangan baku sampel dihitung.
• Simpangan baku populasi diberikan oleh={ (xi-µ)2/ n} di mana adalah rata-rata populasi dan n adalah ukuran populasi tetapi simpangan baku sampel diberikan oleh S={ (xi-ẍ)2 / (n-1)} di mana adalah mean sampel dan n adalah ukuran sampel.