Ünite 1: İstatistiğin Tanımı, Konusu ve Temel Kavramlar
İstatistik, belirsizlik altında doğru karar verebilmek için verilerin toplanması, temizlenmesi, analiz edilmesi ve yorumlanması bilimidir.
- Kolektif ve Tipik Olay: İstatistiğin asıl konusu “kolektif olaylar”dır. Tek bir gözlemle anlaşılamayan, ancak çok sayıda gözlemle genel bir eğilimi ortaya çıkan olaylara (örneğin doğumlar, trafik kazaları) denir. “Tipik olaylar” ise her seferinde aynı sonucu verir ve istatistiğin ilgi alanına girmez.
- Betimsel ve Çıkarımsal İstatistik: Betimsel istatistik, eldeki veriyi tablolar, grafikler ve ortalamalarla özetler (geçmişi anlatır). Çıkarımsal istatistik ise olasılık teorisini kullanarak örneklemden ana kütleye (popülasyona) dair tahminlerde bulunur (geleceği yordar).
Ünite 2: Birim, Vasıf, Şık ve Verinin Ölçüm Düzeyi
Verinin temel yapı taşlarını anlamak analiz için şarttır.
- Birim: Hakkında veri topladığımız en küçük parçadır (bir öğrenci, bir aile, bir işletme). Maddi birimler (insan) ve maddi olmayan birimler (evlenme olayı) olarak ayrılır.
- Vasıf ve Şık: Birimin sahip olduğu özellik “vasıf” (örneğin göz rengi), bu özelliğin aldığı değer ise “şık”tır (mavi).
- Ölçüm Düzeyleri: 1. Sınıflama (Nominal): Gruplandırma yapar; sayıların büyüklük anlamı yoktur (0: Kadın, 1: Erkek). 2. Sıralama (Ordinal): Bir hiyerarşi vardır ama aradaki fark eşit değildir (1. Üstmen, 2. Yüzbaşı). 3. Aralık (Interval): Farklar anlamlıdır ancak sıfır noktası “yokluk” ifade etmez (Sıcaklık: 0 derece sıcaklığın olmadığı anlamına gelmez). 4. Oran (Ratio): En gelişmiş ölçek; gerçek sıfır vardır ve çarpma/bölme yapılabilir (Gelir, ağırlık).
Ünite 3: Verilerin Düzenlenmesinde Tasnif ve Gruplama
Ham veriler (yığın) işlenmedikçe bilgiye dönüşmez.
- Tasnif: Aynı şıkka sahip birimlerin frekanslarını (tekrarlanma sayısı) gösteren tablolardır.
- Gruplama: Veriler çok çeşitliyse (örneğin 1000 kişinin farklı yaşları), bunlar belli sınıflara bölünür (20-30 yaş arası gibi).
- Sınıf Limitleri ve Orta Nokta: Her grubun bir alt ve üst sınırı vardır. Analizlerde grubu temsil eden değer, o grubun orta noktasıdır. Gruplandırma veri kaybına neden olsa da büyük resmi görmeyi sağlar.
Ünite 4: Verilerin Düzenlenmesinde Seriler ve Grafikler
Düzenlenen veriler çeşitli formatlarda sunulur:
- Zaman Serileri: Verinin yıllar veya aylar içindeki değişimidir.
- Mekan Serileri: Coğrafi bölgelere göre yapılan dağılımdır.
- Bileşik Seriler: Hem zaman hem de mekanın bir arada olduğu serilerdir.
- Grafikler: Nitel veriler için “Çubuk” ve “Daire” (Pasta) grafikler; nicel veriler için “Histogram” ve “Frekans Poligonu” kullanılır. Grafik, rakamların arasındaki ilişkiyi kelimelerden daha hızlı anlatır.
Ünite 5: Analitik Ortalamalar – Aritmetik Ortalama
Seriyi tek bir sayı ile temsil eden duyarlı ölçülerdir.
- Tanım: Tüm değerlerin toplamının gözlem sayısına bölünmesidir.
- Özellikler: Her gözlemi hesaba kattığı için en hassas ortalamadır. Ancak seride bir tane bile çok büyük veya çok küçük sayı varsa (aşırı uç), ortalama o yöne kayar ve yanıltıcı olabilir.
- Ağırlıklı Ortalama: Birimlerin önem dereceleri farklıysa (ders kredileri gibi), değerler ağırlıklarıyla çarpılarak ortalama alınır.
Ünite 6: Analitik Ortalamalar – Geometrik ve Kareli Ortalamalar
Aritmetik ortalamanın uygun olmadığı özel durumlar içindir:
- Geometrik Ortalama: Sayıların çarpımlarının n. dereceden köküdür. Genellikle yıllara göre büyüme oranları, faiz artışları veya nüfus değişim hızı gibi oransal değişimlerde kullanılır.
- Kareli Ortalama: Değerlerin kareleri toplamının ortalamasının kareköküdür. Negatif değerlerin bulunduğu serilerde işaret farkını ortadan kaldırmak için (örneğin standart sapma hesaplamalarında) kritik öneme sahiptir.
Ünite 7: Verilerin Özetlenmesi: Analitik Olmayan Ortalamalar
Tüm seriyi değil, sadece serinin belirli bir pozisyonunu dikkate alan “duyarsız” ölçülerdir:
- Mod (Tepe Değer): Seride en çok tekrarlanan değerdir. Uç değerlerden etkilenmez. Bir serinin birden fazla modu olabilir veya hiç olmayabilir. En popüler olanı temsil eder.
- Medyan (Ortanca): Küçükten büyüğe dizilen seriyi tam ortadan ikiye bölen değerdir. Serinin %50’si medyandan küçük, %50’si medyandan büyüktür. Gelir dağılımı gibi aşırı uçların olduğu serilerde en güvenilir merkez göstergesidir.
- Kartiller (Çeyreklikler): Seriyi dört eşit parçaya bölen değerlerdir (Q1, Q2/Medyan, Q3). Verinin yayılımını anlamamıza yardımcı olur.
Ünite 8: Dağılma Ölçüleri (Değişkenlik Ölçüleri)
Ortalamalar serinin merkezini gösterir, ancak verilerin bu merkez etrafında nasıl yayıldığını anlamak için dağılma ölçülerine ihtiyaç duyarız.
- Değişim Aralığı (Ranj): En büyük değer ile en küçük değer arasındaki farktır. Basittir ancak uç değerlerden çok etkilenir.
- Standart Sapma ve Varyans: İstatistiğin en önemli dağılma ölçüleridir. Verilerin aritmetik ortalamadan ne kadar uzaklaştığının ortalamasını verir. Sapma ne kadar küçükse, veriler ortalamaya o kadar yakın ve seri o kadar homojendir.
- Ortalama Sapma: Değerlerin ortalamadan farklarının mutlak değerlerinin ortalamasıdır.
Ünite 9: Nispi Dağılma Ölçüleri ve Şekil Parametreleri
Farklı birimlerle ölçülen (örneğin boy ve kilo) veya ortalamaları çok farklı olan serileri kıyaslamak için kullanılır.
- Değişim Katsayısı (V): Standart sapmanın aritmetik ortalamaya oranının yüzde ifadesidir. İki farklı grubun değişkenliğini kıyaslamada standart sapmadan daha güvenilirdir.
- Asimetri (Çarpıklık): Serinin normal dağılıma göre ne yöne eğildiğini gösterir. Eğer ortalama, medyandan büyükse seri “sağa çarpık” (pozitif); küçükse “sola çarpık” (negatif) olarak adlandırılır.
- Basıklık: Dağılımın tepesinin ne kadar sivri veya basık olduğunu gösterir.
Ünite 10: Olasılık – Temel Kavramlar
İstatistiğin çıkarımsal kısmına geçiş köprüsüdür.
- Deney ve Örnek Uzay: Bir olayın tüm mümkün sonuçlarının kümesine örnek uzay denir.
- Olasılık Tanımları: Klasik yaklaşım (beklenen sonuçlar / tüm sonuçlar) ve frekansçı yaklaşım (deney tekrarlandıkça ortaya çıkan oran) üzerinden hesaplanır.
- Olay Türleri: Birbirini engelleyen (ayrık) olaylar ve birbirinden bağımsız olayların olasılıkları farklı toplama ve çarpma kurallarına tabidir.
Ünite 11: Tesadüfi Değişken ve Olasılık Dağılımları
Sayısal sonuçları olan olayların matematiksel modellenmesidir.
- Kesikli ve Sürekli Değişkenler: Tam sayılarla ifade edilen (çocuk sayısı gibi) değişkenlere kesikli; bir aralıktaki tüm değerleri alabilen (boy, süre gibi) değişkenlere sürekli değişken denir.
- Beklenen Değer: Bir tesadüfi değişkenin uzun vadede alması beklenen ortalama değerdir.
Ünite 12: Binom, Poisson ve Normal Dağılımlar
Gerçek hayattaki olayların çoğu belirli kalıplara (dağılımlara) uyar.
- Binom Dağılımı: Sadece iki sonucun (başarı/başarısızlık) olduğu durumlarda kullanılır.
- Poisson Dağılımı: Belirli bir zaman veya mekan aralığında nadir gerçekleşen olayların (bir saatte gelen çağrı sayısı gibi) olasılığını hesaplar.
- Normal Dağılım (Gauss): Doğadaki olayların çoğunun uyduğu, çan eğrisi şeklindeki dağılımdır. Ortalaması 0, standart sapması 1 olan türüne “Standart Normal Dağılım” (Z tablosu) denir.
Ünite 13: Endeksler
Ekonomik ve sosyal olaylardaki zaman içindeki oransal değişimleri ölçer.
- Basit Endeksler: Tek bir malın fiyat veya miktar değişimini gösterir.
- Bileşik Endeksler: Birden fazla malın (sepetin) değişimini ölçer. En bilinenleri Laspeyres (temel yıl miktarlarını esas alır) ve Paasche (cari yıl miktarlarını esas alır) endeksleridir. Enflasyon hesaplamalarının temelidir.
Ünite 14: Örnekleme ve Tahminleme
Tüm kitleye ulaşmanın imkansız olduğu durumlarda kullanılır.
- Örnekleme Yöntemleri: Basit tesadüfi, tabakalı ve küme örnekleme gibi yöntemlerle ana kütleyi temsil edecek küçük bir grup seçilir.
- Nokta ve Aralık Tahmini: Ana kütle parametresi (örneğin Türkiye yaş ortalaması) ya tek bir sayı olarak (nokta) ya da belirli bir güven seviyesinde (%95 güvenle gibi) bir aralık olarak tahmin edilir.
