Yapay Zeka ve Makine Öğrenmesi Bütünleme Sınavı Soruları

Yapay Zeka ve Makine Öğrenmesi 2025 Bütünleme

Bu bütünleme sınavı; yapay sinir ağlarında (YSA) bias nöronunun işlevi ve drop-out tekniği, karar ağaçlarında yaprak düğüm tanımı ve entropi hesaplaması, k-En Yakın Komşu (k-NN) algoritmasının çalışma mantığı, Naive Bayes sınıflandırıcısının temel varsayımları, basit/çoklu doğrusal regresyon hesaplamaları ve model performans değerlendirme (çapraz geçerleme, R2 skoru) metriklerini kapsamaktadır.

Sınavda Hangi Konular Var? (Özeti Görmek İçin Tıkla ⬇️)

MAKİNE ÖĞRENMESİ BÜTÜNLEME 2025 Sınav Soruları Özeti

Bu belge, Makine Öğrenmesi dersine ait bütünleme sınavı (20-06-2025 tarihli) sorularını içermektedir. Sorular, yapay sinir ağları, karar ağaçları, k-En Yakın Komşu (k-NN), Naive Bayes, derin öğrenme, regresyon modelleri, veri ön işleme ve değerlendirme metrikleri gibi konuları kapsamaktadır.

Temel Konular ve Kavramlar:

Veri görselleştirme üzerine özelleşmiş Python kütüphanelerinden biri Matplotlib‘dir.

Yapay Sinir Ağları:

Bias nöronunun işlevi, bir nöron çıktısının bir tür esneklikle ayarlanmasını sağlamak ve modelin öğrenme kapasitesini artırmasına yardımcı olmaktır.

Drop-out tekniği, eğitim sırasında bazı nöronların geçici olarak devre dışı bırakılmasını sağlar.

Karar Ağaçları:

Yaprak (leaf) düğüm, sınıflandırma ya da regresyon sonucunu temsil eden ve alt düğümü olmayan son düğümdür.

Budama (pruning) işlemi, modelin aşırı uyumunu engellemeye yardımcı olur, karmaşıklığını azaltır ve genelleme kapasitesini artırır; ancak modelin eğitim verisine daha iyi uymasını sağlamak yanlıştır.

k-En Yakın Komşu (k-NN) ve Sınıflandırma:

Sınıf etiketi bilinmeyen bir örnek, çoğunluk oylaması (majority voting) stratejisine göre en yakın komşularının en çok tekrar eden sınıfına atanır.

k-NN’de temel adım, $k$ komşunun ortalamasının alınarak sınıf etiketinin belirlenmesi değildir; doğru adımlar uzaklıkların hesaplanması, sıralanması ve en yakın $k$ komşunun sınıf etiketine göre tahmin yapılmasıdır.

KNeighborsClassifier(n_neighbors=5, metric="euclidean") parametreleri, test verisindeki bir müşteriye en yakın 5 komşunun Öklid uzaklığına göre sınıf tahmini yapılacağını ifade eder.

Naive Bayes:

Naive Bayes sınıflandırma algoritmasının temel varsayımı, tahmini sağlayan niteliklerin birbirinden bağımsız olduğudur.

Regresyon ve Değerlendirme:

Basit doğrusal regresyon modelinde, $\beta_0=50$ ve $\beta_1=8$ katsayılarına göre 40 dakika egzersiz yapan bir üyenin tahmini yakacağı kalori miktarı 370’tir ($50 + 8 \times 40$).

Çoklu doğrusal regresyon denklemi, $\beta$ katsayıları ve bağımsız değişkenlerle (motorHacmi, agirlik, silindirSayisi) kurulan doğrusal ilişkiyi ifade eder.

Doğrusal regresyon modelinin veriyi ne kadar iyi açıkladığını değerlendiren ve toplam değişkenliğin açıklanan oranını tanımlayan ölçü $R^2$ değeridir.

Sınıflandırma modelinin test performansını değerlendirmek için Silhouette katsayısı kullanılamaz; kesinlik, doğruluk, duyarlılık ve hata oranı kullanılabilir.

Diğer Konular:

Eksik verinin tamamlanması amacıyla kullanılan Python fonksiyonu fillna()‘dır.

Derin öğrenme modelleri yalnızca az sayıda katmandan oluşmaz.

Çapraz geçerleme için her katlamada sınıf dağılımını koruyacak şekilde (stratified) 5 katlı bir işlem için StratifiedKFold(n_splits=5, shuffle=True) doğru Python kod bloğudur.

Pekiştirmeli öğrenme (reinforcement learning) stratejisine örnek olarak otonom bir aracın trafik ışıklarına ve yol koşullarına göre doğru zamanda durması veya ilerlemesi gösterilebilir.

Kümeleme algoritmaları, veri noktalarını benzerlik ve uzaklıklarına göre gruplandırmak amacıyla kullanılır ve danışmansız öğrenme kapsamındadır.

Sonuçlar

#1. Aşağıdakilerden hangisi bias nöronunun yapay sinir ağlarında üstlendiği işlevlerden biridir?

Nöronun çıktısını sabitlemek.

Tüm ağırlıkları sıfırlayarak eğitimi kolaylaştırmak.

Aktivasyon fonksiyonunu devre dışı bırakmak.

Nöronlar arası bağlantıyı ortadan kaldırmak.

Bir nöron çıktısının bir tür esneklikle ayarlanmasını sağlamak ve modelin öğrenme kapasitesini artırmasına yardımcı olmak.

#2. Aşağıdakilerden hangisi karar ağacında yaprak (leaf) düğümün doğru bir tanımıdır?

Kök düğüm ile yaprak düğüm arasındaki bağlantıyı sağlayan yoldur.

Ağacın en üstünde yer alan ve tüm karar sürecini başlatan düğümdür.

Sınıflandırma ya da regresyon sonucunu temsil eden ve alt düğümü olmayan son düğümdür.

Veri setini bir niteliğe göre bölen ve en az bir alt düğüme sahip olan düğümdür.

Veri setindeki belirli bir özelliğe göre testlerin yapıldığı düğümdür.

#3. Bir nitelikte yer alan eksik verinin tamamlanması amacıyla aşağıdaki hangi Python fonksiyonu kullanılabilir?

qcut()

fillna()

isnull()

cut()

astype()

#4. from sklearn.neighbors import KNeighborsClassifier knn_modeli = KNeighborsClassifier(n_neighbors=5 metric=’euclidean’) knn_modeli.fit(X_egitim y_musteriSinifi) Bir perakende şirketi müşterileri harcama alışkanlıklarına göre sınıflandırmak için yukarıdaki Python kodunu kullanarak bir k-En Yakın Komşu (k-NN) modeli oluşturmuştur. Kodda kullanılan n_neighbors=5 ve metric=’euclidean’ parametrelerini aşağıdaki açıklamalardan hangisi en doğru biçimde ifade eder?

Model yalnızca sayısal verilerle çalışabilir ve k değeri dinamik olarak belirlenir.

Model sınıfı bilinmeyen bir müşteri için yalnızca en uzak 5 komşuya bakar.

Model eğitimde kullanılan 5 gözlemi rastgele seçerek sınıfı tahmin eder.

Model test verisindeki bir müşteriye en yakın 5 komşunun Öklid uzaklığına göre sınıf tahmini yapar.

Model 5 farklı sınıf arasında tahmin yapabilir ve Manhattan uzaklığını temel alır.

#5. Aşağıda “Satın Alma Durumu” niteliğine ait sınıf dağılımı verilmiştir: Satın Alma Durumu Evet Evet Hayır Hayır Hayır Yukarıda verilen bilgilere göre bu niteliğin belirsizliğini ölçmek için kullanılan Entropi değeri nasıl hesaplanır?

#6. Aşağıdaki ifadelerden hangisi derin öğrenme (deep learning) kavramının temel özelliklerinden biri değildir?

Derin öğrenme temsili öğrenmeye olanak tanır.

Derin öğrenme modellerinde veriler katmanlı yapılar aracılığıyla temsil edilir.

Derin öğrenme bilgisayarların deneyimlerden öğrenmesini sağlar.

Derin öğrenme modelleri yalnızca az sayıda katmandan oluşur.

Derin öğrenme karmaşık kavramları daha basit olanlardan oluşturarak öğrenir.

#7. Bir sınıflandırma problemi için k-En Yakın Komşu (k-NN) algoritması kullanılmıştır. Test örneğinin sınıf etiketi bilinmemektedir. Aşağıda bu test örneğine en yakın k = 5 komşunun sınıf etiketleri verilmiştir: Komşu 1: A Komşu 2: B Komşu 3: A Komşu 4: C Komşu 5: A Çoğunluk oylaması ( majority voting) stratejisine göre test örneği hangi sınıfa atanır?

Sınıf A ve B arasında rastgele seçim yapılır.

Sınıf A'ya atanır.

Sınıf C'ye atanır.

Bu durumda sınıf belirlenemez.

Sınıf B'ye atanır.

#8. Bir spor salonu üyelerin egzersiz süresi (dakika cinsinden) ile yakılan kalori miktarı arasında doğrusal bir ilişki olduğunu varsayarak basit doğrusal regresyon modeli kurmuştur. Model katsayıları şunlardır: β0 = 50 β1 = 8. Buna göre 40 dakika egzersiz yapan bir üyenin yakacağı tahmini kalori miktarı aşağıdakilerden hangisidir?

370

400

360

2008

#9. Karar ağaçlarında budama (pruning) işlemi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

Budama modelin karmaşıklığını azaltır.

Budama işlemi karar ağacındaki önemsiz dalları kaldırmayı amaçlar.

Budama ile modelin sadece eğitim verisi üzerinde değil daha önce görmediği yeni verilere karşı da doğru tahminlerde bulunabilme becerisi (genelleme kapasitesi) artırılabilir.

Budama modelin aşırı uyum yapmasını engellemeye yardımcı olur.

Budama modelin eğitim verisine daha iyi uymasını sağlar.

#10. Bir araştırmacı bir sınıflandırma modelini değerlendirmek istemektedir. Bu nedenle her katlamada sınıf dağılımını koruyacak şekilde 5 katlı bir çapraz geçerleme yapmak istemektedir. Buna göre aşağıdaki Python kod bloklarından hangisi bu işlemin doğru bir şekilde gerçekleştirilmesini sağlar?

#11. Bir hastanede tespit edilen kitlelerin iyi huylu veya kötü huylu olma durumları Naive Bayes algoritması kullanılarak sınıflandırılmıştır. Buna göre hem modelin tahmini (predicted) hem de gerçek sınıfı (true) “kötü huylu” (kotu) olan örneklerin sayısı kaçtır?

300

713

705

#12. Aşağıdakilerden hangisi Naive Bayes sınıflandırma algoritmasının temel varsayımlarından biridir?

Tahmini sağlayan nitelikler arasında tam bağımlılık olduğu

Naive Bayes'in yalnızca sayısal verilerle çalışabilmesi

Veri setindeki tüm değişkenlerin kategorik olması

Tahmini sağlayan niteliklerin birbirinden bağımsız olduğu

Tüm değişkenlerin doğrusal ilişki içinde olması

#13. Aşağıdakilerden hangisi bir sınıflandırma modelinin test performansını değerlendirmek için kullanılamaz?

Kesinlik

Silhouette katsayısı

Doğruluk

Duyarlılık

Hata oranı

#14. Bir doğrusal regresyon modelinin başarısının değerlendirilmesinde modelin veriyi ne kadar iyi açıkladığı dikkate alınmaktadır. Bu amaçla sıklıkla kullanılan ölçülerden biri … değeridir. Bu ölçü regresyon modeli tarafından açıklanan toplam değişkenliğin oranı ile tanımlanmaktadır. Yukarıda … ile verilen boşluğa aşağıdaki seçeneklerden hangisi getirilebilir?

Silhouette

Doğruluk

katsayısı

RMSE

#15. Aşağıdakilerden hangisi yapay sinir ağları ile kullanılan drop-out tekniğinin bir özelliğidir?

Eğitim sırasında bazı nöronların geçici olarak devre dışı bırakılmasını sağlar.

Tüm nöronların her eğitim adımında aktif olmasını sağlar.

Test verilerine göre ağı her seferinde yeniden eğitir.

Eğitim verilerini daha büyük hale getirir.

Ağırlıkların her zaman sabit kalmasını sağlar.

#16. Aşağıdaki problemlerden hangisi pekiştirmeli öğrenme (reinforcement learning) stratejisine örnek olarak gösterilebilir?

Otonom bir aracın trafik ışıklarına ve yol koşullarına göre doğru zamanda durması veya ilerlemesi.

Bir web sitesine gelen ziyaretçilerin etkileşim düzeyine göre kullanıcı segmentlerine ayrılması.

Emlak verilerine dayanarak bir dairenin piyasa fiyatının tahmin edilmesi.

Bir müşterinin kredi puanı ve gelir düzeyine göre kredi başvurusunun onaylanıp onaylanmayacağının tahmin edilmesi.

Müşteri yorumlarının pozitif negatif veya nötr olarak sınıflandırılması.

#17. Bir otomobil üreticisi araçların yakıt tüketimini (litre/100km) tahmin etmek amacıyla çoklu doğrusal regresyon modeli kurmuştur. Bağımlı değişken yakıt tüketimi (tuketim) olup bağımsız değişkenler ve bu değişkenler için elde edilen beta katsayıları şöyledir: Sabit değer için β0=2.5 motorHacmi (litre) için β1=1.2 agirlik (kg) için β2=0.003 silindirSayisi (adet) için β3=0.8. Verilen katsayılar doğrultusunda aşağıdaki seçeneklerden hangisi bu modelin doğru regresyon denklemidir?

tuketim = 2.5 + 1.2 x motorHacmi + 0.003 x agirlik + 0.8 x silindirSayisi

silindirSayisi = 2.5 + 0.8 x motorHacmi + 1.2 x agirlik + 0.003 x tuketim

tuketim = 2.5 x 1.2 + motorHacmi x 0.003 + agirlik x 0.8 + silindirSayisi

tuketim = 2.5 + 1.2 x motorHacmi + 0.8 x agirlik + 0.003 x silindirSayisi

tuketim = 2.5 x 0.003 + motorHacmi x 1.2 + agirlik x 0.8 + silindirSayisi

#18. Aşağıdakilerden hangisi k-En Yakın Komşu (k-NN) algoritması ile sınıflandırma işlemi gerçekleştirilirken izlenen temel adımlardan biri değildir?

Sınıf etiketi bilinmeyen örnek ile tüm eğitim verisi arasındaki uzaklıklar hesaplanır.

Komşular arasında en fazla tekrar eden sınıf etiketi tahmin olarak atanır.

Uzaklık hesaplamasında Öklid Manhattan gibi çeşitli fonksiyonlar kullanılabilir.

k komşunun ortalaması alınarak sınıf etiketi belirlenir.

Hesaplanan uzaklıklar küçükten büyüğe sıralanır ve en yakın k komşu belirlenir.

#19. Aşağıdakilerden hangisi Python programlama dilinde veri görselleştirme üzerine özelleşmiş kütüphanelerden biridir?

Scikit-learn

Keras

Matplotlib

Tensorflow

NumPy

#20. Danışmansız öğrenme kapsamında yapılan kümeleme analizleriyle ilgili aşağıdaki ifadelerden hangisi doğrudur?

Kümeleme analizleri yalnızca kategorik veri içeren veri setlerine uygulanabilir.

Kümeleme algoritmaları yalnızca danışmanlı öğrenme (supervised learning) algoritmalarından biridir.

Kümeleme algoritmaları veri noktalarını benzerlik ve uzaklıklarına göre gruplandırmak amacıyla kullanılır.

Kümeleme analizlerinde sınıf etiketleri (hedef nitelik) mutlaka kullanılmalıdır.

Kümeleme analizleri yalnızca görselleştirme amacıyla kullanılır ve analiz sonuçları veri madenciliğinde kullanılmaz.

Öncesi

Sınavı Bitir ve Sonucu Gör.