
Yapay Zeka ve Makine Öğrenmesi 2025 Bütünleme
Bu bütünleme sınavı; yapay sinir ağlarında (YSA) bias nöronunun işlevi ve drop-out tekniği, karar ağaçlarında yaprak düğüm tanımı ve entropi hesaplaması, k-En Yakın Komşu (k-NN) algoritmasının çalışma mantığı, Naive Bayes sınıflandırıcısının temel varsayımları, basit/çoklu doğrusal regresyon hesaplamaları ve model performans değerlendirme (çapraz geçerleme, R2 skoru) metriklerini kapsamaktadır.
Sınavda Hangi Konular Var? (Özeti Görmek İçin Tıkla ⬇️)
MAKİNE ÖĞRENMESİ BÜTÜNLEME 2025 Sınav Soruları Özeti
Bu belge, Makine Öğrenmesi dersine ait bütünleme sınavı (20-06-2025 tarihli) sorularını içermektedir. Sorular, yapay sinir ağları, karar ağaçları, k-En Yakın Komşu (k-NN), Naive Bayes, derin öğrenme, regresyon modelleri, veri ön işleme ve değerlendirme metrikleri gibi konuları kapsamaktadır.
Temel Konular ve Kavramlar:
Veri görselleştirme üzerine özelleşmiş Python kütüphanelerinden biri Matplotlib‘dir.
Yapay Sinir Ağları:
Bias nöronunun işlevi, bir nöron çıktısının bir tür esneklikle ayarlanmasını sağlamak ve modelin öğrenme kapasitesini artırmasına yardımcı olmaktır.
Drop-out tekniği, eğitim sırasında bazı nöronların geçici olarak devre dışı bırakılmasını sağlar.
Karar Ağaçları:
Yaprak (leaf) düğüm, sınıflandırma ya da regresyon sonucunu temsil eden ve alt düğümü olmayan son düğümdür.
Budama (pruning) işlemi, modelin aşırı uyumunu engellemeye yardımcı olur, karmaşıklığını azaltır ve genelleme kapasitesini artırır; ancak modelin eğitim verisine daha iyi uymasını sağlamak yanlıştır.
k-En Yakın Komşu (k-NN) ve Sınıflandırma:
Sınıf etiketi bilinmeyen bir örnek, çoğunluk oylaması (majority voting) stratejisine göre en yakın komşularının en çok tekrar eden sınıfına atanır.
k-NN’de temel adım, $k$ komşunun ortalamasının alınarak sınıf etiketinin belirlenmesi değildir; doğru adımlar uzaklıkların hesaplanması, sıralanması ve en yakın $k$ komşunun sınıf etiketine göre tahmin yapılmasıdır.
KNeighborsClassifier(n_neighbors=5, metric="euclidean") parametreleri, test verisindeki bir müşteriye en yakın 5 komşunun Öklid uzaklığına göre sınıf tahmini yapılacağını ifade eder.
Naive Bayes:
Naive Bayes sınıflandırma algoritmasının temel varsayımı, tahmini sağlayan niteliklerin birbirinden bağımsız olduğudur.
Regresyon ve Değerlendirme:
Basit doğrusal regresyon modelinde, $\beta_0=50$ ve $\beta_1=8$ katsayılarına göre 40 dakika egzersiz yapan bir üyenin tahmini yakacağı kalori miktarı 370’tir ($50 + 8 \times 40$).
Çoklu doğrusal regresyon denklemi, $\beta$ katsayıları ve bağımsız değişkenlerle (motorHacmi, agirlik, silindirSayisi) kurulan doğrusal ilişkiyi ifade eder.
Doğrusal regresyon modelinin veriyi ne kadar iyi açıkladığını değerlendiren ve toplam değişkenliğin açıklanan oranını tanımlayan ölçü $R^2$ değeridir.
Sınıflandırma modelinin test performansını değerlendirmek için Silhouette katsayısı kullanılamaz; kesinlik, doğruluk, duyarlılık ve hata oranı kullanılabilir.
Diğer Konular:
Eksik verinin tamamlanması amacıyla kullanılan Python fonksiyonu fillna()‘dır.
Derin öğrenme modelleri yalnızca az sayıda katmandan oluşmaz.
Çapraz geçerleme için her katlamada sınıf dağılımını koruyacak şekilde (stratified) 5 katlı bir işlem için StratifiedKFold(n_splits=5, shuffle=True) doğru Python kod bloğudur.
Pekiştirmeli öğrenme (reinforcement learning) stratejisine örnek olarak otonom bir aracın trafik ışıklarına ve yol koşullarına göre doğru zamanda durması veya ilerlemesi gösterilebilir.
Kümeleme algoritmaları, veri noktalarını benzerlik ve uzaklıklarına göre gruplandırmak amacıyla kullanılır ve danışmansız öğrenme kapsamındadır.
Sonuçlar
#1. Aşağıdakilerden hangisi bias nöronunun yapay sinir ağlarında üstlendiği işlevlerden biridir?
#2. Aşağıdakilerden hangisi karar ağacında yaprak (leaf) düğümün doğru bir tanımıdır?
#3. Bir nitelikte yer alan eksik verinin tamamlanması amacıyla aşağıdaki hangi Python fonksiyonu kullanılabilir?

#4. from sklearn.neighbors import KNeighborsClassifier knn_modeli = KNeighborsClassifier(n_neighbors=5 metric=’euclidean’) knn_modeli.fit(X_egitim y_musteriSinifi) Bir perakende şirketi müşterileri harcama alışkanlıklarına göre sınıflandırmak için yukarıdaki Python kodunu kullanarak bir k-En Yakın Komşu (k-NN) modeli oluşturmuştur. Kodda kullanılan n_neighbors=5 ve metric=’euclidean’ parametrelerini aşağıdaki açıklamalardan hangisi en doğru biçimde ifade eder?

#5. Aşağıda “Satın Alma Durumu” niteliğine ait sınıf dağılımı verilmiştir: Satın Alma Durumu Evet Evet Hayır Hayır Hayır Yukarıda verilen bilgilere göre bu niteliğin belirsizliğini ölçmek için kullanılan Entropi değeri nasıl hesaplanır?
#6. Aşağıdaki ifadelerden hangisi derin öğrenme (deep learning) kavramının temel özelliklerinden biri değildir?
#7. Bir sınıflandırma problemi için k-En Yakın Komşu (k-NN) algoritması kullanılmıştır. Test örneğinin sınıf etiketi bilinmemektedir. Aşağıda bu test örneğine en yakın k = 5 komşunun sınıf etiketleri verilmiştir: Komşu 1: A Komşu 2: B Komşu 3: A Komşu 4: C Komşu 5: A Çoğunluk oylaması ( majority voting) stratejisine göre test örneği hangi sınıfa atanır?
#8. Bir spor salonu üyelerin egzersiz süresi (dakika cinsinden) ile yakılan kalori miktarı arasında doğrusal bir ilişki olduğunu varsayarak basit doğrusal regresyon modeli kurmuştur. Model katsayıları şunlardır: β0 = 50 β1 = 8. Buna göre 40 dakika egzersiz yapan bir üyenin yakacağı tahmini kalori miktarı aşağıdakilerden hangisidir?
#9. Karar ağaçlarında budama (pruning) işlemi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?
#10. Bir araştırmacı bir sınıflandırma modelini değerlendirmek istemektedir. Bu nedenle her katlamada sınıf dağılımını koruyacak şekilde 5 katlı bir çapraz geçerleme yapmak istemektedir. Buna göre aşağıdaki Python kod bloklarından hangisi bu işlemin doğru bir şekilde gerçekleştirilmesini sağlar?

