Measuring Dispersion dalam Konsep Statistik

7:50 PM
Measuring Dispersion dalam Konsep Statistik
Di Posting Oleh : wandi
Kategori : Data Science

 

Measuring Dispersion dalam Konsep Statistik

Halo teman-teman! Setelah sebelumnya kita membahas tentang measuring central tendency, kali ini kita akan membahas konsep yang nggak kalah penting dalam statistik, yaitu measuring dispersion atau ukuran penyebaran data. Kalau ukuran pemusatan membantu kita mengetahui nilai "pusat" data, ukuran penyebaran membantu kita memahami seberapa tersebar data tersebut. Yuk, langsung kita bahas lebih dalam!

Apa Itu Measuring Dispersion?

Measuring dispersion adalah cara untuk mengukur sejauh mana data tersebar di sekitar nilai pusat (seperti mean, median, atau mode). Dengan mengetahui penyebaran data, kita bisa memahami tingkat variasi, konsistensi, atau homogenitas data tersebut.

Ada beberapa ukuran penyebaran yang sering digunakan, di antaranya:

  1. Range (Rentang)
  2. Variance (Varians)
  3. Standard Deviation (Simpangan Baku)
  4. Interquartile Range (Rentang Interkuartil)
  5. Mean Absolute Deviation (MAD)

1. Range (Rentang)

Range adalah selisih antara nilai maksimum dan minimum dalam data.

Rumus Range:

Range=Nilai MaksimumNilai Minimum\text{Range} = \text{Nilai Maksimum} - \text{Nilai Minimum}

Contoh:

Data: 5, 8, 10, 6, 9.

Range=105=5\text{Range} = 10 - 5 = 5

Kelebihan:

  • Mudah dihitung.

Kekurangan:

  • Hanya menggunakan dua nilai ekstrem, sehingga kurang representatif untuk dataset besar.

2. Variance (Varians)

Variance mengukur rata-rata kuadrat deviasi (penyimpangan) tiap nilai dari mean. Semakin besar nilai varians, semakin besar penyebaran data.

Rumus Variance:

Untuk data populasi:

σ2=(xiμ)2N\sigma^2 = \frac{\sum (x_i - \mu)^2}{N}

Untuk data sampel:

S2=(xixˉ)2n1S^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}
  • xix_i: Nilai individu.
  • μ\mu: Mean populasi.
  • xˉ\bar{x}: Mean sampel.
  • NN: Jumlah data populasi.
  • nn: Jumlah data sampel.

Contoh:

Data: 5, 8, 10.

Mean=5+8+103=7.67\text{Mean} = \frac{5+8+10}{3} = 7.67 σ2=(57.67)2+(87.67)2+(107.67)23=4.22\sigma^2 = \frac{(5-7.67)^2 + (8-7.67)^2 + (10-7.67)^2}{3} = 4.22

Kelebihan:

  • Menggunakan semua nilai dalam data.

Kekurangan:

  • Menghasilkan satuan kuadrat yang sulit diinterpretasikan secara langsung.

3. Standard Deviation (Simpangan Baku)

Standard deviation adalah akar kuadrat dari varians. Ukuran ini lebih mudah diinterpretasikan karena memiliki satuan yang sama dengan data aslinya.

Rumus Standard Deviation:

σ=σ2\sigma = \sqrt{\sigma^2}

Contoh:

Dari contoh varians sebelumnya:

σ=4.222.05\sigma = \sqrt{4.22} \approx 2.05

Kelebihan:

  • Lebih mudah diinterpretasikan daripada varians.

Kekurangan:

  • Sensitif terhadap outlier.

4. Interquartile Range (IQR)

IQR adalah rentang antara kuartil pertama (Q1) dan kuartil ketiga (Q3), yang mencakup 50% data di tengah.

Rumus IQR:

IQR=Q3Q1\text{IQR} = Q3 - Q1

Contoh:

Data: 5, 6, 8, 9, 10.

  • Q1 = 6, Q3 = 9.
IQR=96=3\text{IQR} = 9 - 6 = 3

Kelebihan:

  • Tidak terpengaruh oleh outlier.

Kekurangan:

  • Tidak menggunakan semua data.

5. Mean Absolute Deviation (MAD)

MAD mengukur rata-rata absolut deviasi tiap nilai dari mean.

Rumus MAD:

MAD=xixˉn\text{MAD} = \frac{\sum |x_i - \bar{x}|}{n}

Contoh:

Data: 5, 8, 10.

Mean=7.67\text{Mean} = 7.67 MAD=57.67+87.67+107.6731.78\text{MAD} = \frac{|5-7.67| + |8-7.67| + |10-7.67|}{3} \approx 1.78

Kelebihan:

  • Mudah dihitung.

Kekurangan:

  • Kurang sering digunakan dibandingkan varians atau simpangan baku.

Mengapa Measuring Dispersion Penting?

Ukuran penyebaran memberikan konteks tambahan untuk ukuran pemusatan. Dua dataset bisa saja memiliki mean yang sama, tetapi penyebarannya berbeda. Contoh:

  • Data A: 5, 5, 5, 5, 5 (penyebaran kecil).
  • Data B: 1, 3, 5, 7, 9 (penyebaran besar).

Tanpa ukuran penyebaran, kita tidak bisa memahami variasi dalam data tersebut.


Kesimpulan

Measuring dispersion adalah aspek penting dalam analisis data. Dengan memahami ukuran seperti range, varians, simpangan baku, IQR, dan MAD, kita bisa mendapatkan gambaran yang lebih lengkap tentang data kita. Jadi, jangan lupa untuk selalu mengevaluasi penyebaran data saat melakukan analisis statistik!

Kalau ada pertanyaan atau pengalaman menarik soal topik ini, share di kolom komentar ya! Sampai jumpa di artikel berikutnya!


Mau liat atau download source code aplikasi premium bisa disini.
Previous
Next Post »
0 Komentar