Dersin İçeriği
Veri Ambarı, Tanımı, Özellikleri, Mimarisi, OLTP, OLAP Veri Madenciliğinin Tanımı, Tarihçesi, Neden Veri Madenciliği?, Veri Madenciliğinin Uygulama Alanları, Faydaları Veri Madenciliğinin Diğer Disiplinler ile İlişkisi Veri Madenciliği Süreci, Problemin Tanımlanması Verinin Hazırlanması, Veri Toplama, Veri Önişleme, Veri Temizleme Veri Birleştirme (Bütünleştirme), Veri İndirgeme, Veri Dönüştürme, Min-Maks Normalleştirme, Z-Skor Normalleştirme, Onluk Ölçüde Normalleştirme Modelin Kurulması ve Değerlendirilmesi, Modelin Kullanılması, Modelin İzlenmesi Veri Madenciliği Modelleri, Tahmin Edici Modeller, Tanımlayıcı Modeller Sınıflandırma, Tanımı ve Amacı, Sınıflandırma Yöntemleri Karar Ağaçları, Dallanma Kriterleri, Entropi, Gini İndeksi, Towing İndeksi, Ağaç Budama Kuralları, Karar Ağacı Algoritmaları, ID3, C4.5, CART, CHAID, SLIQ, QUEST Mesafeye Dayalı Yöntemler, K-En Yakın Komşu İstatistiğe Dayalı Algoritmalar, Regresyon, Bayes/Navie Bayes Kümeleme, Tanımı ve Amacı Benzerlik ve Uzaklık kavramı, Öklid Uzaklığı, Manhattan Uzaklığı, Minkowski Uzaklığı Kümeleme Yöntemleri, Hiyerarşik Kümeleme Yöntemleri, En Yakın Komşu (Tek Bağlantı) Algoritması, En Uzak Komşu (Tam Bağlantı) Algoritması Hiyerarşik Olmayan Kümeleme Yöntemleri, K-Means (K-Ortalama) Algoritması, K-Medoids Algoritması Birliktelik Kuralı, tanımı ve amacı, Market Sepeti Analizi, Tanımı ve Amacı, Destek ve Güven Ölçütleri, Apriori Algoritması Veri Madenciliğinin Diğer Yöntemler ile Karşılaştırılması Diğer Yöntemler, Yapay Sinir Ağları, Genetik Algoritmalar, Destek Vektör Makineleri