Veri istatistik
Veri
Bir sonuç çıkarmak ya da çözüme ulaşabilmek için deney, araştırma ve gözlem gibi yöntemlerle elde edilen her bilgiye veri denir.
Kesikli Veri
Belirli bir aralıktaki her gerçek sayı değerini alamayan veri türüdür. Örneğin, bir öğrencinin günlere göre çözdüğü soru sayısı, nüfus, marketin günlere göre sattığı gazete sayısı vb.
Sürekli Veri
Belirli bir aralıktaki her gerçek sayı değerini alabilen veri türüdür. Örneğin, boy ölçümleri, kilo ölçümleri veya bir aracın zamana göre tükettiği yakıt miktarı vb.
Merkezi Eğilim Ölçüleri
Bir konuda toplanan verilerin hangi değer etrafında toplandığı hakkında yorum yapmamızı sağlar.
- Aritmetik ortalama
- Mod (tepe değeri)
- Medyan (ortanca)
Aritmetik Ortalama
Verilerin sayı değerleri toplamının veri sayısına bölünmesi ile bulunur ve \( \overline{X} \) ile gösterilir.
Örnek
Üç sayının aritmetik ortalaması 20’dir.
Bu sayılara toplamları 10 olan iki sayı daha eklendiğinde yeni aritmetik ortalama kaç olur?
Çözüm
Üç sayının toplamı:
\[ 20 \cdot 3 = 60 \]
Yeni toplam:
\[ 60 + 10 = 70 \]
Yeni aritmetik ortalama:
\[ A.O = \frac{70}{5} = 14 \]
Mod (Tepe Değer)
Bir veri grubunda en çok tekrar eden değere mod (tepe değer) denir.
- Birden fazla en çok tekrarlanan veriler olursa mod birden fazladır.
- Bütün verilerin tekrar etme sayıları eşit ise mod yoktur.
- Tekrarlanan veri yoksa mod yoktur.
Örneğin:
- 1, 1, 1, 2, 2, 3, 7 veri dizisinin modu 1’dir.
- 1, 2, 2, 3, 3, 4, 4 veri dizisinin modu yoktur.
- 2, 3, 3, 4, 6, 6, 7, 9 veri dizisinin modu 3 ve 6 olmak üzere iki tanedir.
Örnek
Aşağıdaki tabloda İzmir ilinin haziran ayına ait sıcaklık değerleri ve gün sayıları verilmiştir.
Sıcaklık | Gün |
---|---|
17° | 2 |
18° | 4 |
20° | 5 |
23° | 10 |
27° | 9 |
Buna göre, sıcaklık değerlerinin modu kaçtır?
Çözüm
En çok 23° olduğu için mod 23’tür.
Medyan (Ortanca)
Bir veri grubundaki terimler küçükten büyüğe doğru sıralandığında tam ortada kalan değere medyan (ortanca) denir.
- Veri sayısı tek sayı ise medyan ortadaki terimdir.
- Veri sayısı çift sayı ise medyan ortadaki iki terimin aritmetik ortalamasıdır.
- Medyan veri grubunun içinde yer alan bir değer olmak zorunda da değildir.
Örneğin:
- 1, 1, 2, 4, 5, 7, 8, 8, 9 veri dizisinin terim sayısı tek sayı olduğundan medyanı 5’tir.
- 2, 4, 7, 8, 10, 11, 11, 12 veri dizisinin terim sayısı çift sayı olduğundan medyanı \(\frac{8+10}{2} = 9\)’dur.
Örnek
9, 4, 5, 7, 8, 3 veri dizisine x doğal sayısı eklendiğinde medyan değişmemektedir.
Buna göre, x değeri aşağıdakilerden hangisidir?
Çözüm
Veri dizisini sıralayalım: 3, 4, 5, 7, 8, 9
Medyan: \(\frac{5+7}{2} = 6\)
x = 6 olursa medyan değişmez.
Merkezi Yayılım Ölçüleri
Merkezi yayılım ölçüleri veri grubunun dağılımı hakkında bilgi verir.
- En büyük değer – En küçük değer
- Açıklık (Ranj)
- Standart sapma
En Büyük Değer – En Küçük Değer
Verilerin en küçüğüne en küçük değer, en büyüğüne en büyük değer denir.
Örneğin, 2, 3, 4, 6, 6, 7, 8, 10 veri grubunda en küçük değer 2 ve en büyük değer 10’dur.
Açıklık (Ranj)
Veri grubundaki en büyük değer ile en küçük değer arasındaki farka açıklık denir.
Örneğin, ardışık 5 tek sayıdan oluşan veri dizisinin açıklığını bulalım:
Sayılar x, x + 2, x + 4, x + 6, x + 8 olsun.
Bu durumda en küçük değer x, en büyük değer x + 8 olduğundan açıklık 8’dir.
Örnek
9, 8, 10, a, 15, 12 veri grubunun açıklığı 13 olduğuna göre, a’nın alabileceği değerler toplamı kaçtır?
Çözüm
a en büyük değer ise: a – 8 = 13 → a = 21
a en küçük değer ise: 15 – a = 13 → a = 2
Bu durumda a’nın alabileceği değerler toplamı: 21 + 2 = 23
Standart Sapma
Sonlu bir veri dizisinde her bir terimin aritmetik ortalama ile farkının kareleri toplamı bulunur. Bu toplam veri adedinin 1 eksiğine bölünüp karekökü alındığında standart sapma bulunur.
\(X\) grubun aritmetik ortalaması olmak üzere, \(x_1, x_2, x_3, \ldots, x_n\) veri grubunun standart sapması:
\[ S = \sqrt{\frac{(x_1 – X)^2 + (x_2 – X)^2 + \ldots + (x_n – X)^2}{n – 1}} \]
- Standart sapma bir sayı dizisinin aritmetik ortalamaya yakın olup olmadığını ölçer.
- Standart sapma ne kadar küçükse veriler birbirine yakın, öğrenci grubu ise homojen gruptur.
- Standart sapma ne kadar büyükse, veriler birbirinden uzak ve test ayırt ediciliği yüksek bir grubu ifade eder.
Örnek
4, 5, 6, 9 sayı dizisinin standart sapmasını bulalım:
Aritmetik Ortalama: \( X = \frac{4 + 5 + 6 + 9}{4} = 6 \)
Standart Sapma:
\[ S = \sqrt{\frac{(4-6)^2 + (5-6)^2 + (6-6)^2 + (9-6)^2}{3}} = \sqrt{\frac{14}{3}} \]
Not
- Her terimi eşit olan veri grubunun standart sapması \(0\)’dır.
- Veri grubundaki her sayı aynı sayı ile çarpılırsa standart sapma da aynı sayı ile çarpılır.
Örneğin, \(a, b, c, d, e\) sayılarından oluşan bir veri grubunun standart sapması \(x\) ise:
\(5a, 5b, 5c, 5d, 5e\) sayılarından oluşan veri grubunun standart sapması \(5 \cdot x\) olur.
Çözümlü Soru
Aşağıdaki tabloda Emre ve Sergen’in oynadıkları 4 maçta attıkları gol sayıları verilmiştir.
Futbolcu | Maç 1 | Maç 2 | Maç 3 | Maç 4 |
---|---|---|---|---|
Emre | 5 | 3 | 2 | 6 |
Sergen | 4 | 3 | 6 | 3 |
Tabloya göre hangi futbolcunun daha iyi golcü olduğunu bulalım.
Örnek Çözüm
Emre’nin attığı gol sayılarının aritmetik ortalaması:
\[ \overline{X} = \frac{5 + 3 + 2 + 6}{4} = 4 \]
Sergen’in attığı gol sayılarının aritmetik ortalaması:
\[ \overline{X} = \frac{4 + 3 + 6 + 3}{4} = 4 \]
İki futbolcunun da gol sayılarının aritmetik ortalaması aynı olduğundan aralarındaki farklılık için standart sapmaya bakılmalıdır. (Aritmetik ortalamaları farklı olsaydı, büyük ortalamalı futbolcu daha iyi olacaktı.)
Emre’nin standart sapması:
\[ S_1 = \sqrt{\frac{(5-4)^2 + (3-4)^2 + (2-4)^2 + (6-4)^2}{3}} = \sqrt{\frac{10}{3}} \]
Sergen’in standart sapması:
\[ S_2 = \sqrt{\frac{(4-4)^2 + (3-4)^2 + (6-4)^2 + (3-4)^2}{3}} = \sqrt{2} \]
Standart sapması küçük olan Sergen, daha istikrarlı olduğundan daha iyi bir futbolcudur.
Veri istatistik
