Veri Madenciliği 2025 Vize


Veri Madenciliği 2025 Vize

Bu final sınavı; veri, enformasyon, bilgi hiyerarşisini, sınıflandırma ve kümeleme algoritmalarının temel özelliklerini (K-Ortalamalar, DBSCAN, k-NN), regresyon (Doğrusal, Lojistik, Ordinal) uygulamalarını, birliktelik analizi (destek, güven oranları), doğal dil işleme (NLP) / metin madenciliği analizlerini ve veri normalizasyon işlemlerini kapsamaktadır.


Sınavda Hangi Konular Var? (Özeti Görmek İçin Tıkla ⬇️)

Sorular ve Konular:

Örneklem Alma Motivasyonu: Maliyetli veya zaman alıcı analizleri kolaylaştırmaktır.

Çoklu Doğrusal Regresyon Analizi: Birden fazla bağımsız değişkenin bağımlı değişken üzerindeki etkilerini incelemek için kullanılır.

Sürekli Değişken Örnekleri: Bir otomobilin yakıt tüketimi gibi değerler örnek verilebilir.

Öznitelik Ayrıklaştırması: Sürekli bir değişkenin kategorik bir değişkene dönüştürülmesini içerir.

Binomial Cevap Örnekleri: İşe alma veya almama kararı gibi ikili sonuçlar örnek verilebilir.

Veri Madenciliği Yöntemleri: Oluşturulan bir modelin gerçek dünya verileriyle uyumunu belirlemek için Doğrulama ve Değerlendirme teknikleri kullanılmalıdır.

Özet İstatistikler:

Medyan, Varyans, Mod, Ortalama ve Aralık gibi kavramlar bulunmaktadır.

Frekans, bir veri setinde belirli bir değerin kaç kez tekrarlandığını gösterir.

Korelasyon Analizi: Otomobilin hızı ile yakıt tüketimi arasında pozitif bir korelasyon bulunması, hız arttıkça yakıt tüketiminin de artacağı anlamına gelir.

Yapısal Veri: Bir blog yazısının metni yapısal veri örneği değildir.

Saçılım Grafiği: Aykırı değerleri görmek için kullanılabileceği belirtilmiş ancak sorunun bir seçeneği “Aykırı değerleri görmek için kullanılamaz” şeklinde yanlış bir ifade olarak sunulmuştur. X ekseni bağımsız değişkeni, Y ekseni bağımlı değişkeni temsil eder.

Lojistik Regresyon: En uygun eğriyi bulmak için En olası tahmin (En Çok Olabilirlik Tahmini) yöntemi kullanılır.

Boyut Azaltmanın Avantajı: Veri işleme sürelerini kısaltır.

Örneklem Alma Yöntemi: Değiştirme olmadan örneklem alma yöntemi, seçilen her öğenin veri kümesinden çıkarıldığı yöntemdir.

Veri Birleştirme: Detayların kaybolma riski yıllık bazda verileri birleştirmede daha yüksektir.

Kök ve Yaprak Grafikleri: Yalnızca sürekli veriler için kullanılır.

Regresyon Analizi Problemi (15. Soru): Eğitim süresi (X) ve hatasız parça sayısı (Y) arasındaki ilişkiyi tahmin etmek için bir veri seti sunulmuştur. 6 saat eğitim alan bir çalışanın üreteceği hatasız ürün sayısı tahmin sorusu sorulmuştur.

Veri Madenciliği Tanımı: Veri setlerinden değerli bilgilerin çıkarılması için kullanılan bir dizi teknik ve yöntem bütünüdür.

Hipotez Testleri: Veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını ve değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirir (I ve II doğrudur).


 

Sonuçlar

#1. Aşağıdakilerden hangisi çoklu doğrusal regresyon analizinin bir özelliğidir?

#2. Aşağıdakilerden hangisi bir sürekli değişken örneğidir?

#3. Öznitelik ayrıklaştırması aşağıdakilerden hangisini içerir?

#4. Aşağıdakilerden hangisi binomial cevaplara örnektir?

#5. Aşağıdakilerden hangisi yapısal veri örneği değildir?

#6. Saçılım grafiği ile ilgili aşağıdakilerden hangisi yanlıştır?

#7. Bir şirket pazarlama stratejilerini optimize etmek için veri madenciliği yöntemlerini kullanıyor. Yeni bir reklam kampanyası başlatmadan önce müşterilerin geçmiş alışveriş alışkanlıklarını analiz etmek istiyorlar. Bu amaçla mevcut müşteri veri seti üzerinde bir model oluşturulmuştur. Şirket oluşturulan modelin gerçek dünya verileriyle ne kadar uyumlu olduğunu belirlemek için hangi teknikleri kullanmalıdır?

#8. Aşağıdaki özet istatistiklerden hangisi veri setinin genel dağılımı hakkında temel bir fikir verir ancak tüm değerleri dikkate almaz?

#9. Bir araştırmacı bir otomobilin hızı ile yakıt tüketimi arasındaki ilişkiyi incelemek için korelasyon analizi yapmaktadır. Araştırmacı bu iki değişken arasında pozitif bir korelasyon olduğunu bulursa bunun anlamı aşağıdakilerden hangisidir?

#10. Lojistik regresyonda en uygun eğriyi bulmak için aşağıdaki yöntemlerden hangisi kullanılır?

#11. Aşağıdakilerden hangisi boyut azaltmanın avantajları ile ilgili doğru bir bilgidir?

#12. Değiştirme olmadan örneklem alma yöntemi nedir?

#13. Aşağıdakilerden hangisi kök ve yaprak grafiklerinin bir özelliğidir?

#14. Aşağıdaki ifadelerden hangisi tanımlayıcı istatistiklerde frekans ve mod ile ilgili doğrudur?

#15. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden) günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Yukarıdaki bilgilere göre 6 saat eğitim alan bir çalışanın üreteceği hatasız ürün sayısı regresyon analiziyle tahmin edildiğinde aşağıdakilerden hangisi doğru olur?

#16. Bir üretim hattında çalışan mavi yakalıların işleri konusunda aldıkları eğitimin süresinin (saat cinsinden) günde hatasız ürettikleri parça sayısı üzerindeki etkisi tahmin edilmek isteniyor. Yukarıdaki bilgilere göre basit doğrusal regresyon denklemi aşağıdakilerden hangisidir?

#17. Veri birleştirme işlemi yapılırken detayların kaybolma riski hangi durumda daha yüksektir?

#18. Veri madenciliği aşağıdakilerden hangisini ifade eder?

#19. I. Veri madenciliğinde hipotez testleri elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. II. Hipotez testleri değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. III. Hipotez testleri veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır. Hipotez testleri ile ilgili yukarıdaki ifadelerden hangisi veya hangileri doğrudur?

#20. Örneklem almanın motivasyonu aşağıdakilerden hangisidir?

Öncesi
Sınavı Bitir ve Sonucu Gör.

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top