Yapay Zeka ve Makine Öğrenmesi 2025 Bütünleme


Yapay Zeka ve Makine Öğrenmesi 2025 Bütünleme

Bu bütünleme sınavı; yapay sinir ağlarında (YSA) bias nöronunun işlevi ve drop-out tekniği, karar ağaçlarında yaprak düğüm tanımı ve entropi hesaplaması, k-En Yakın Komşu (k-NN) algoritmasının çalışma mantığı, Naive Bayes sınıflandırıcısının temel varsayımları, basit/çoklu doğrusal regresyon hesaplamaları ve model performans değerlendirme (çapraz geçerleme, R2 skoru) metriklerini kapsamaktadır.


Sınavda Hangi Konular Var? (Özeti Görmek İçin Tıkla ⬇️)

MAKİNE ÖĞRENMESİ BÜTÜNLEME 2025 Sınav Soruları Özeti

Bu belge, Makine Öğrenmesi dersine ait bütünleme sınavı (20-06-2025 tarihli) sorularını içermektedir. Sorular, yapay sinir ağları, karar ağaçları, k-En Yakın Komşu (k-NN), Naive Bayes, derin öğrenme, regresyon modelleri, veri ön işleme ve değerlendirme metrikleri gibi konuları kapsamaktadır.

Temel Konular ve Kavramlar:

Veri görselleştirme üzerine özelleşmiş Python kütüphanelerinden biri Matplotlib‘dir.

Yapay Sinir Ağları:

Bias nöronunun işlevi, bir nöron çıktısının bir tür esneklikle ayarlanmasını sağlamak ve modelin öğrenme kapasitesini artırmasına yardımcı olmaktır.

Drop-out tekniği, eğitim sırasında bazı nöronların geçici olarak devre dışı bırakılmasını sağlar.

Karar Ağaçları:

Yaprak (leaf) düğüm, sınıflandırma ya da regresyon sonucunu temsil eden ve alt düğümü olmayan son düğümdür.

Budama (pruning) işlemi, modelin aşırı uyumunu engellemeye yardımcı olur, karmaşıklığını azaltır ve genelleme kapasitesini artırır; ancak modelin eğitim verisine daha iyi uymasını sağlamak yanlıştır.

k-En Yakın Komşu (k-NN) ve Sınıflandırma:

Sınıf etiketi bilinmeyen bir örnek, çoğunluk oylaması (majority voting) stratejisine göre en yakın komşularının en çok tekrar eden sınıfına atanır.

k-NN’de temel adım, $k$ komşunun ortalamasının alınarak sınıf etiketinin belirlenmesi değildir; doğru adımlar uzaklıkların hesaplanması, sıralanması ve en yakın $k$ komşunun sınıf etiketine göre tahmin yapılmasıdır.

KNeighborsClassifier(n_neighbors=5, metric="euclidean") parametreleri, test verisindeki bir müşteriye en yakın 5 komşunun Öklid uzaklığına göre sınıf tahmini yapılacağını ifade eder.

Naive Bayes:

Naive Bayes sınıflandırma algoritmasının temel varsayımı, tahmini sağlayan niteliklerin birbirinden bağımsız olduğudur.

Regresyon ve Değerlendirme:

Basit doğrusal regresyon modelinde, $\beta_0=50$ ve $\beta_1=8$ katsayılarına göre 40 dakika egzersiz yapan bir üyenin tahmini yakacağı kalori miktarı 370’tir ($50 + 8 \times 40$).

Çoklu doğrusal regresyon denklemi, $\beta$ katsayıları ve bağımsız değişkenlerle (motorHacmi, agirlik, silindirSayisi) kurulan doğrusal ilişkiyi ifade eder.

Doğrusal regresyon modelinin veriyi ne kadar iyi açıkladığını değerlendiren ve toplam değişkenliğin açıklanan oranını tanımlayan ölçü $R^2$ değeridir.

Sınıflandırma modelinin test performansını değerlendirmek için Silhouette katsayısı kullanılamaz; kesinlik, doğruluk, duyarlılık ve hata oranı kullanılabilir.

Diğer Konular:

Eksik verinin tamamlanması amacıyla kullanılan Python fonksiyonu fillna()‘dır.

Derin öğrenme modelleri yalnızca az sayıda katmandan oluşmaz.

Çapraz geçerleme için her katlamada sınıf dağılımını koruyacak şekilde (stratified) 5 katlı bir işlem için StratifiedKFold(n_splits=5, shuffle=True) doğru Python kod bloğudur.

Pekiştirmeli öğrenme (reinforcement learning) stratejisine örnek olarak otonom bir aracın trafik ışıklarına ve yol koşullarına göre doğru zamanda durması veya ilerlemesi gösterilebilir.

Kümeleme algoritmaları, veri noktalarını benzerlik ve uzaklıklarına göre gruplandırmak amacıyla kullanılır ve danışmansız öğrenme kapsamındadır.


 

Sonuçlar

#1. Aşağıdakilerden hangisi bias nöronunun yapay sinir ağlarında üstlendiği işlevlerden biridir?

#2. Aşağıdakilerden hangisi karar ağacında yaprak (leaf) düğümün doğru bir tanımıdır?

#3. Bir nitelikte yer alan eksik verinin tamamlanması amacıyla aşağıdaki hangi Python fonksiyonu kullanılabilir?

#4. from sklearn.neighbors import KNeighborsClassifier knn_modeli = KNeighborsClassifier(n_neighbors=5 metric=’euclidean’) knn_modeli.fit(X_egitim y_musteriSinifi) Bir perakende şirketi müşterileri harcama alışkanlıklarına göre sınıflandırmak için yukarıdaki Python kodunu kullanarak bir k-En Yakın Komşu (k-NN) modeli oluşturmuştur. Kodda kullanılan n_neighbors=5 ve metric=’euclidean’ parametrelerini aşağıdaki açıklamalardan hangisi en doğru biçimde ifade eder?

#5. Aşağıda “Satın Alma Durumu” niteliğine ait sınıf dağılımı verilmiştir: Satın Alma Durumu Evet Evet Hayır Hayır Hayır Yukarıda verilen bilgilere göre bu niteliğin belirsizliğini ölçmek için kullanılan Entropi değeri nasıl hesaplanır?

#6. Aşağıdaki ifadelerden hangisi derin öğrenme (deep learning) kavramının temel özelliklerinden biri değildir?

#7. Bir sınıflandırma problemi için k-En Yakın Komşu (k-NN) algoritması kullanılmıştır. Test örneğinin sınıf etiketi bilinmemektedir. Aşağıda bu test örneğine en yakın k = 5 komşunun sınıf etiketleri verilmiştir: Komşu 1: A Komşu 2: B Komşu 3: A Komşu 4: C Komşu 5: A Çoğunluk oylaması ( majority voting) stratejisine göre test örneği hangi sınıfa atanır?

#8. Bir spor salonu üyelerin egzersiz süresi (dakika cinsinden) ile yakılan kalori miktarı arasında doğrusal bir ilişki olduğunu varsayarak basit doğrusal regresyon modeli kurmuştur. Model katsayıları şunlardır: β0 = 50 β1 = 8. Buna göre 40 dakika egzersiz yapan bir üyenin yakacağı tahmini kalori miktarı aşağıdakilerden hangisidir?

#9. Karar ağaçlarında budama (pruning) işlemi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

#10. Bir araştırmacı bir sınıflandırma modelini değerlendirmek istemektedir. Bu nedenle her katlamada sınıf dağılımını koruyacak şekilde 5 katlı bir çapraz geçerleme yapmak istemektedir. Buna göre aşağıdaki Python kod bloklarından hangisi bu işlemin doğru bir şekilde gerçekleştirilmesini sağlar?

#11. Bir hastanede tespit edilen kitlelerin iyi huylu veya kötü huylu olma durumları Naive Bayes algoritması kullanılarak sınıflandırılmıştır. Buna göre hem modelin tahmini (predicted) hem de gerçek sınıfı (true) “kötü huylu” (kotu) olan örneklerin sayısı kaçtır?

#12. Aşağıdakilerden hangisi Naive Bayes sınıflandırma algoritmasının temel varsayımlarından biridir?

#13. Aşağıdakilerden hangisi bir sınıflandırma modelinin test performansını değerlendirmek için kullanılamaz?

#14. Bir doğrusal regresyon modelinin başarısının değerlendirilmesinde modelin veriyi ne kadar iyi açıkladığı dikkate alınmaktadır. Bu amaçla sıklıkla kullanılan ölçülerden biri … değeridir. Bu ölçü regresyon modeli tarafından açıklanan toplam değişkenliğin oranı ile tanımlanmaktadır. Yukarıda … ile verilen boşluğa aşağıdaki seçeneklerden hangisi getirilebilir?

#15. Aşağıdakilerden hangisi yapay sinir ağları ile kullanılan drop-out tekniğinin bir özelliğidir?

#16. Aşağıdaki problemlerden hangisi pekiştirmeli öğrenme (reinforcement learning) stratejisine örnek olarak gösterilebilir?

#17. Bir otomobil üreticisi araçların yakıt tüketimini (litre/100km) tahmin etmek amacıyla çoklu doğrusal regresyon modeli kurmuştur. Bağımlı değişken yakıt tüketimi (tuketim) olup bağımsız değişkenler ve bu değişkenler için elde edilen beta katsayıları şöyledir: Sabit değer için β0=2.5 motorHacmi (litre) için β1=1.2 agirlik (kg) için β2=0.003 silindirSayisi (adet) için β3=0.8. Verilen katsayılar doğrultusunda aşağıdaki seçeneklerden hangisi bu modelin doğru regresyon denklemidir?

#18. Aşağıdakilerden hangisi k-En Yakın Komşu (k-NN) algoritması ile sınıflandırma işlemi gerçekleştirilirken izlenen temel adımlardan biri değildir?

#19. Aşağıdakilerden hangisi Python programlama dilinde veri görselleştirme üzerine özelleşmiş kütüphanelerden biridir?

#20. Danışmansız öğrenme kapsamında yapılan kümeleme analizleriyle ilgili aşağıdaki ifadelerden hangisi doğrudur?

Öncesi
Sınavı Bitir ve Sonucu Gör.

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top