Veri Madenciliği 2025 Final


Veri Madenciliği 2025 Final

Bu final sınavı; veri, enformasyon, bilgi hiyerarşisini, sınıflandırma ve kümeleme algoritmalarının temel özelliklerini (K-Ortalamalar, DBSCAN, k-NN), regresyon (Doğrusal, Lojistik, Ordinal) uygulamalarını, birliktelik analizi (destek, güven oranları), doğal dil işleme (NLP) / metin madenciliği analizlerini ve veri normalizasyon işlemlerini kapsamaktadır.


Sınavda Hangi Konular Var? (Özeti Görmek İçin Tıkla ⬇️)

VERİ MADENCİLİĞİ – FİNAL SINAVI ÖZETİ

Sunulan belge, Veri Madenciliği dersine ait bir final sınavının çoktan seçmeli sorularını içermektedir. Sorular, temel veri madenciliği konularına odaklanmaktadır:

  • Kümeleme ve Sınıflandırma:
    • Kümeleme analizinin temel hedefi, bir grup içindeki nesnelerin birbirine benzer olması ve diğer gruplardaki nesnelerden farklı olmasıdır.
    • Sınıflandırma modelinin kullanım amacı, nesneleri farklı sınıflara ayırt etmek ve bilinmeyen kayıtların sınıflarını tahmin etmektir.
    • DBSCAN algoritmasında epsilon, bir veri noktasının etrafındaki n boyutlu bir kürenin yarıçapı; minPts ise bir veri noktasının ulaşılabilir olması için gerekli komşu sayısıdır.
    • k-NN algoritması, hem sınıflandırma hem de regresyon türündeki tahmin görevleri için kullanılabilir.
    • K-Ortalamalar algoritması ile elde edilebilecek olası bir sonuç, farklı segmentlerdeki müşterilerin davranışları hakkında genel eğilimler ve kalıplar belirlemektir.
  • Regresyon ve Fonksiyonlar:
    • Doğrusal regresyonda en uygun çizgi, En Küçük Kareler yöntemi ile bulunmaya çalışılır.
    • İkili sonuçların doğasına daha uygun tahminler üreten fonksiyon Sigmoid fonksiyonudur.
    • Bağımlı değişkenin ikili olduğu durumlarda ve değişen varyanslı hatalar olduğunda doğrusal regresyon kullanılması uygun olmaz.
    • Sıralı kategorilere sahip bir yanıt değişkeni için kullanılan lojistik regresyon türü Ordinal lojistik regresyondur.
  • Metin Madenciliği ve Doğal Dil İşleme:
    • Metin madenciliği, metinsel veri kaynaklarından yeni ve faydalı bilgi keşfetmeye odaklanır.
    • Gizli Anlam Çözümlemesi (LSA), anlamı benzer olan kelimelerin genellikle aynı bağlamda kullanılması ilkesine dayanır.
    • Duygu analizi, insanların belirli bir konuda ne hissettiği sorusuna cevap vermeye çalışır.
  • Birliktelik Analizi ve Diğer Kavramlar:
    • Birliktelik analizinde güven oranı, bir kuralın güvenilirliğini ölçer.
    • {Ekmek} -> {Süt} [Destek = %20, Güven = %70] kuralına göre, müşterilerin %70’i ekmek satın aldığında süt de satın almaktadır ve müşterilerin %20’si hem ekmek hem de süt satın almaktadır.
    • Normalizasyonun önemi, ölçekler arasındaki farklılıkları dengelemektir.
    • Veri, enformasyon ve bilgi arasındaki ilişki, “Veri, satış verilerinin incelenmesiyle; enformasyon, grafiklerin oluşturulmasıyla; bilgi, önerilerin sunulmasıyla oluşur” ifadesiyle açıklanabilir.

Ayrıca, sınavda normal dağılım olasılığı hesabı ile ilgili bir soru ve bir karar ağacının okunmasına yönelik bir soru yer almaktadır.


 

Sonuçlar

#1. Kümeleme analizinin temel hedefi aşağıdakilerden hangisidir?

#2. Doğrusal regresyonda aşağıdaki yöntemlerden hangisi ile en uygun çizgi bulmaya çalışılır?

#3. Bir fabrikada üretilen pillerin ömrü normal dağılım göstermektedir. Pillerin ortalama ömrü 40 saat ve standart sapması 5 saattir. Rastgele seçilen bir pilin 33 saatten daha kısa süre dayanma olasılığı yaklaşık olarak değeri aşağıdakilerden hangisidir?

#4. Aşağıdaki fonksiyonlardan hangisi ikili sonuçların doğasına daha uygun tahminler üretir?

#5. DBSCAN algoritmasında epsilon ve minPts (minimum nokta sayısı) ile aşağıdakilerden hangisi ifade edilir?

#6. Metin madenciliği aşağıdaki konulardan hangisine ana konu olarak odaklanır?

#7. Bir sınıflandırma modelinin kullanım amacı aşağıdakilerden hangisidir?

#8. I={a b c d e} kümesinden oluşturulan {a b c}→{d} kuralı düşük güven oranlı bir kuralsa aşağıdakilerden hangisi düşük oranlı bir kuraldır?

#9. Gizli Anlam Çözümlemesi (LSA) aşağıdaki ilkelerden hangisine dayanır?

#10. Sıralı kategorilere sahip olan bir yanıt değişkeni için kullanılan lojistik regresyon türü aşağıdakilerden hangisidir?

#11. Duygu analizi aşağıdaki sorulardan hangisine cevap vermeye çalışmaktadır? İnsanlar belirli bir konuda ne hissediyor?

#12. Yeni bir girişimci olan Onur online bir alışveriş platformu kurmaya karar verdi. İlk adım olarak platformunda hangi ürünlerin daha popüler olduğunu belirlemek için geçmiş aylara ait ürünlerin adı satış tarihi fiyatı ve müşteri bilgileri gibi satış verilerini incelemeye başladı. Onur bu ham verileri analiz etti ve her ay hangi ürünlerin daha fazla talep gördüğünü belirlemek için grafikler oluşturdu. Ardından Onur bu analizlerin bir özetini oluşturarak iş ortağına sunmaya karar verdi. Bu özet belirli mevsimlerde hangi ürünlerin daha fazla talep gördüğünü ve stok yönetimi için öneriler içeriyordu. Yukarıdaki hikaye hangi aşamada veri enformasyon ve bilgi arasındaki ilişkiyi en iyi açıklar?

#13. I. Değişen varyanslı hatalar olduğunda II. Bağımlı değişken sürekli olduğunda III. Bağımlı değişken ikili olduğunda. Yukarıda yer alan durumlardan hangisi/hangilerinde doğrusal regresyon kullanılması uygun olmaz?

#14. Birliktelik analizinde güven oranı ile ölçülen aşağıdakilerden hangisidir?

#15. I. 25 yaşında sigara içen biri yüksek riskli sınıfındadır. II. 60 kg ağırlığında ve 45 yaşındaki biri yüksek riskli sınıfındadır. III. 22 yaşındaki herkes düşük riskli sınıfındadır. Verilen karar ağacına göre yukarıdaki ifadelerin hangisi/hangileri doğrudur?

#16. Yukarıdaki kutu grafiğine göre aşağıdaki ifadelerden hangisi doğrudur?

#17. Bir e-ticaret şirketi müşteri tabanını 3 farklı segmente ayırmak için K-Ortalamalar algoritmasını kullanmıştır. Analiz sonucunda her bir segment için ortalama satın alma sıklığı ortalama harcama miktarı ve ortalama ziyaret süresi gibi özellikler belirlenmiştir. Aşağıdaki ifadelerden hangisi bu analizden elde edilebilecek en olası sonuçlardan biridir?

#18. k­NN algoritması aşağıdaki türlerden hangisini tahmin görevleri için kullanılabilir?

#19. Normalizasyonun önemi aşağıdakilerden hangisidir?

#20. Bir süpermarketin müşteri verileri analiz edildiğinde aşağıdaki birliktelik kuralı tespit edilmiştir: {Ekmek} – {Süt} [Destek = Güven = ] Bu kurala göre aşağıdaki ifadelerden hangisi doğrudur?

Öncesi
Sınavı Bitir ve Sonucu Gör.

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top