istatistik nedir, istatistik kapsamı nedir, istatistik konuları nedir, nerelerde kullanılır, istatistik ödevi nasıl yapılır, istatistik projesi nasıl yapılır, çözümlü ödev var mı, istatistiğe nasıl çalışmak lazım diye gelen birçok soru mevcuttur. Genel anlamda bu soruların cevaplarını sitemizde bulabilirsiniz ancak , burada daha çok konu başlıklarını bulabilirsiniz.
İstatistik öğrencileri için çok sorun olmasa da diğer bölüm öğrencileri için istatistik ders konuları oldukça karışık gelir. Lisans öğrencilerine, yüksek lisans öğrencilerine istatistik dersi ile olan ödev, soru, proje yardımı yapmaktayız.
Araştırma ve İstatistik
Hakkında Ne Biliyoruz?
Konu Özeti
İstatistik Nedir?
Neden İstatistik?
İnsanlar istatistiği ne zamandır
kullanıyorlar?
İstatistikte Bazı Temel Kavramlar
İstatistiksel Verileri Tasnif Etme
Korelasyon
Grafik Analizi
İstatistik Nedir?
İstatistik, belirli amaçlar için veri toplama, toplanan verileri tasnif etme, çözümleme ve yorumlama bilimidir.
İstatistik sayısal verileri değerlendiren bir bilim dalı
Neden İstatistik?
İstatistik,
Ne kadar?
Ne zaman?
Nerede?
Nasıl?
Kaç tane?
Hangi oranda?
Sorularına yanıt arar
İstatistik, çevremizde olup bitenleri sayılarla ifade etmede yardımcı olur.
İnsanlar İstatistiği Ne zamandır Kullanıyorlar?
1445 – zar atma, şans oyunları
17.Yüzyıl ortaları, istatistik ilk kez ders kitaplarına girdi
İstatistikte Bazı Temel Kavramlar
İstatistikte Bazı Temel kavramlar
Evren
Gözlem alanına giren obje ya da bireylerin tümü
Örneklem
Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup
İstatistikte Bazı Temel kavramlar
Değişken
Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denir
Değişkenler nicel ya da nitel olabilir.
Nitel veriler
Sayısal veriler
-kesikli sayısal veriler (maç kazanma syısı)
-sürekli sayısal veriler (boy, kilo)
Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)
İstatistikte Bazı Temel kavramlar
Ölçme
objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir.
Değişkenler hakkında bilgi edinmek için yapılır
Ölçüm
Ölçme sonucunda elde edilen değer
İstatistikte Bazı Temel kavramlar
Anlamlı rakam
İstatistikte Bazı Temel kavramlar
Verilerin Sınıflandırılması
2,4,4,4,6,6,8,10,12,16,18
En büyük değerden en küçük değer çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek
2-18=16/8=2 veri aralığı 2 dir.
Frekans tablosu hazırlama
Merkezi Eğilim Ölçüleri
İstatistikte Bazı Temel kavramlar
Aritmetik Ortalama
Aralık (range)
Sapma
Standart sapma
Ölçümlerin dağılımı ve standart sapma ile ilişkisi
İstatistikte Bazı Temel kavramlar
Ağırlıklı ortalama
İki eşit gurubun ortalamalarının ortalamasıdır.
Geometrik ortalama
Standart sapma: s
Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür.
Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür.
Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. “Kareli Ortalama Sapma” adı da verilen bu ölçü “değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması”dır
Standart sapma: s
Standart sapma /bütün elemanların ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir.
ve yukarıdaki ifadenin karekökü..
ortalama değer
Ortanca (medyan)
50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2
Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.
Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır
5,5,6,6,7,9,9, 7+1/2
5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5
6+7=13/2=6,5
Tepe değer (mod)
Dağılımda en fazla tekrarlanan değerdir.
Frekansı en fazla olan sınıfın değeridir.
5,5,6,6,6,7,9,9,10
Ölçme Sonucunun Gösterilmesi
İstatistiksel Verileri Tasnif Etme
İstatistiksel Verileri Tasnif Etme
İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:
Sözel ifadelerle açıklama
Tablolar halinde düzenleme
Grafikle gösterme
Verileri değerlendirerek istatistiksel ölçüler bulma
Bu yöntemlerde birkaçını birlikte uygulama
İstatistiksel Verileri Tasnif Etme
Çizgi grafiği
Çubuk Grafik
Çubuk Grafik
Pasta grafiği
ödev
Bir gurup sporcunun ağırlık değerleri aşağıda verilmiştir.
55,56,60,65,65,67,68,70,75,77,80,82,84,86,88,90,92,95,97,100 n=20
İki gurubun sınıflandırması
Sporcuların kuvvet değerleri
Erkek: 10,10,20,20,20,30,30,30,50,40
Bayan: 5,5,10,20,20,20,30,30,40,40,
Veri sınıflandırması
Erkek: 10,10,20,20,20,30,30,30,50,40
Bayan: 5,5,10,20,20,20,30,30,40,40
Basit tablolaştırma
yada
Grafik seçenekleri
NORMAL DAĞILIM NEDIR
İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.
Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır.
Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.
Standart sapması
Frekans eğrisi çan şeklinde olan simetrik dağılımdır.
Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir
Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır.
Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık,
Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.
Dağılım özelliğinin önemi nedir
Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır.
Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir
NORMAL DAĞILIMIN KRİTERLERİ
Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır.
Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.
Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.
Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.
Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir
Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.
2. Varolan verilere parametrik olmayan bir test uygulamak
KESTİRİM
Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır
Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır.
Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.
Hipotez testleri :
Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.
H1 ile gösterilen alternatif hipotez adı verilen hipotez ise, Ho hipotezinin tam tersidir.
P değeri ve yanılma düzeyi :
Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır
Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır.
Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır
Testler
Bağımlı gurup- bağımsız gurup kavramı
Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur
Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.
TESTLER
BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI
İki ortalama arasındaki farkın anlamlılık testi
T. Testi
Gerekli koşullar
1.Karşılaştırılacak iki gurup vardır
2. Guruplar birbirinden bağımsızdır
3. Veriler sürekli veri gurubundadır
4: evren dağılımları normal dağılım gösterir
5. Evren varyansları eşitti.
Mann-Witney U testi
İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır.
Parametrik koşulları sağlanmadığı durumda kullanılır
Bağımsız ikiden çok gurubun karşılaştırılması
Tek yönlü varyans analizi
İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır.
Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.
Varyans analizinde farkın kaynaklandığı gurubu belirleme
Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede
1. duncan yöntemi
Tukey HSD yöntemi
Dunnet yöntemi
Student nevman-Keuls Yöntemi kullanılır
BAĞIMLI İKİ GURUBUN KARŞILAŞTIRILMASI
İKİ EŞ ARASINDAKİ FARKIN ANLAMLILIK TESTİ
SAYFA 149………….
Korelasyon
Korelasyon var mı?
Basit korelasyon işlemlerinde kullanılır.
Grafik çizimi işlem sırası:
Eksenlerin belirlenmesi
Uygun ölçek seçimi
Verilerin yerleştirilmesi
Lineer grafik elde edilmesi
Eğim bulunması
Kaynaklar
Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme
İstatistik Yöntemler ve Uygulaması, H.Arıcı