Büyük Veri 2025 Vize

Büyük Veri 2025 Vize

Bu vize sınavı; büyük veri teknolojileri açık veri örnekleri veri mahremiyeti anonimleştirme ve maskeleme teknikleri ile semantik web hedefleri konularını kapsamaktadır.


 

Sonuçlar

#1. İnsan kaynakları yönetimi gibi organizasyon içindeki belirli bir kullanıcı grubunun belirli taleplerini karşılamak amacıyla geliştirilen büyük veri teknolojisi aşağıdakilerden hangisidir?

#2. Aşağıdakilerden hangisi verinin sınıflandırılmış gruplarından biri değildir?

#3. Açık veri ile ilgili aşağıda verilen bilgilerden hangisi yanlıştır?

#4. Aşağıdakilerden hangisi veri mahremiyeti ile ilgili doğru bir bilgidir?

#5. Açık verinin kullanımı ile sağlanan faydalar ve örneklerin eşleştirilmesinde aşağıdakilerden hangisi yanlıştır?

#6. Aşağıdakilerden hangisi veri maskeleme yöntemlerinden biri değildir?

#7. Aşağıdakilerden hangisi veri mahremiyetinin uygulanmasında ön plana çıkan doğru bir sınıflandırmadır?

#8. Aşağıdakilerden hangisi büyük veri teknolojilerinin fonksiyonellik teknoloji araçları eşleştirmesinde yanlış olarak verilmiştir?

#9. Aşağıdakilerden hangisi büyük veride yapı açısından doğru bir sınıflandırmadır?

#10. I. Uluslararası Açık Bilgi (Open Knowledge International OKI) II. Açık Devlet Ortaklığı (Open Government Partnership OGP) III. Kapalı Veri İzleme (Close Data Watch) IV. Kalkınma İçin Açık Veri (Open Data for Development OD4D) V. Global Açık Veri İnisiyatifi (Global Open Data Initiative GODI) Dünyadaki açık veri örnekleri ile ilgili yukarıda verilen ifadelerden hangisi ya da hangileri doğrudur?

#11. Aşağıdakilerden hangisi semantik web için standart geliştiren bir organizasyondur?

#12. Aşağıdaki şıklarda verilen bilim insanlarından hangisi büyük verinin tarihsel gelişiminde Makine Öğrenimi terimini ilk olarak ortaya atmıştır?

#13. Aşağıdakilerden hangisi büyük verideki kaygılardan biri değildir?

#14. Aşağıda verilen bilgilerden hangisi anonimleştirme için yanlıştır?

#15. … yılında Londralı bilim insanı …in sunduğu istatistiksel veri analizi büyük veri için milat olarak kabul edilir. Yukarıdaki cümlede verilen boşluklara aşağıdaki cümlelerden hangisi gelmelidir?

#16. … varlıkları ilişkileriyle birlikte tanımlayan felsefecilerin kullandığı bir sözcüktür ve semantik web en temel bileşenidir. Yukarıdaki cümlede verilen boşluğa aşağıdakilerden hangisi gelmelidir?

#17. Aşağıdakilerden hangisi hassas bilgilere verilen örneklerden biri değildir?

#18. Aşağıda verilen bilgilerden hangisi bilgi piramidi için yanlıştır?

#19. I. Verinin aktarılacağı tarafın büyüklüğü II. Verinin çeşitliliği III. Veriden sağlanmak istenen fayda IV. Verinin niceliği V. Verinin büyüklüğü. Anonimleştirme yöntemleri uygulanırken veri sorumluları tarafından dikkate alınması gereken özellikler ile ilgili yukarıda verilen ifadelerden hangisi ya da hangileri doğrudur?

#20. Aşağıdakilerden hangisi semantik webin temel hedeflerinden biri değildir?

Öncesi
Sınavı Bitir ve Sonucu Gör.

Büyük Veri Teknolojileri ve Veri Yönetimi Çalışma Kılavuzu

Bu çalışma kılavuzu, büyük veri kavramları, veri sınıflandırma yöntemleri, veri mahremiyeti, açık veri ve semantik web konularını kapsayan kaynak metinler temel alınarak hazırlanmıştır. Kılavuz, öğrenilen bilgileri pekiştirmek amacıyla hazırlanan kısa cevaplı sorular, bir cevap anahtarı, derinlemesine düşünmeyi teşvik eden kompozisyon soruları ve temel terimler sözlüğünden oluşmaktadır.

Bölüm 1: Kısa Cevaplı Sorular

Aşağıdaki soruları kaynak metinde sunulan bilgilere dayanarak, 2-3 cümle ile yanıtlayınız.

  1. Veri Martı (Data Mart) nedir ve organizasyon içindeki işlevi nedir?
  2. Açık veri kavramının temel özelliklerini ve kullanım haklarını açıklayınız.
  3. Veri mahremiyetinin temel amacı ve bu süreçte yapılan sınıflandırmalar nelerdir?
  4. Açık verinin toplum hayatına sağladığı “hayat kurtarıcı çözümler” nelerdir?
  5. Veri maskeleme yöntemleri nelerdir?
  6. Büyük veride yapısal sınıflandırma nasıl yapılır?
  7. Büyük verinin tarihsel gelişiminde 1663 yılının önemi nedir?
  8. Anonimleştirme işlemi sırasında veri kalitesi ve veri kaybı arasındaki ilişkiyi açıklayınız.
  9. Semantik web bağlamında “Ontoloji” terimi neyi ifade eder?
  10. Bilgi Piramidi’nin katmanlarını ve bu katmanların içeriklerini tanımlayınız.

——————————————————————————–

Bölüm 2: Cevap Anahtarı

  1. Veri Martı (Data Mart): Organizasyon içerisinde insan kaynakları yönetimi gibi belirli bir kullanıcı grubunun özel taleplerini karşılamak amacıyla geliştirilen bir büyük veri teknolojisidir. Belirli bir departmana veya amaca yönelik özelleştirilmiş veri yapılarını ifade eder.
  2. Açık Veri: Herhangi bir telif hakkına sahip olmayan, herkes tarafından kullanılabilen ve dağıtılabilen veri türüdür. Ancak açık veri, nitelik ve paylaşım gereksinimlerine tabidir ve sadece veri sahibi tarafından düzenlenebilir.
  3. Veri Mahremiyeti: Veri paylaşımının kötü amaçlı kullanımını önlemek amacıyla yapılır ve verinin kiminle, hangi amaçla paylaşılacağına dair sınırları belirler. Bu kapsamda veriler “Hassas Veri” ve “Genel Veri” olarak doğru bir şekilde sınıflandırılmaktadır.
  4. Hayat Kurtarıcı Çözümler: Açık verinin kullanımı, ölümlü trafik kazalarının büyük oranda engellenmesinde ve acil durumlara müdahale sürelerinin azaltılmasında etkin rol oynar. Bu sayede kamu güvenliği ve sağlık hizmetlerinde iyileşme sağlanır.
  5. Veri Maskeleme Yöntemleri: Veri güvenliğini sağlamak için kullanılan yöntemler arasında Deterministik Veri Maskeleme, Anında Veri Maskeleme, Dinamik Veri Maskeleme ve Statik Veri Maskeleme bulunmaktadır. “Durağan veri maskeleme” bu yöntemler arasında yer almaz.
  6. Yapısal Sınıflandırma: Büyük veride veriler yapısal özelliklerine göre üç ana gruba ayrılır: Yapısal (Structured), Yarı Yapısal (Semi-structured) ve Yapısal Olmayan (Unstructured) veri.
  7. 1663 Yılı ve John Graunt: 1663 yılında Londralı bilim insanı John Graunt tarafından sunulan istatistiksel veri analizi çalışmaları, büyük veri dünyasının miladı olarak kabul edilir.
  8. Anonimleştirme ve Veri Kalitesi: Anonimleştirme, hassas verilerin ifşasını önleyerek veriyi paylaşılabilir kılmayı amaçlar. Ancak bu işlem sırasında oluşan veri kayıpları veri kalitesini düşürür ve veriden sağlanacak faydanın azalmasına neden olur; bu yüzden veri kaybı ile fayda arasında bir denge gözetilmelidir.
  9. Ontoloji: Varlıkları ve bu varlıklar arasındaki ilişkileri tanımlayan, semantik webin en temel bileşeni olan kavramdır. Felsefecilerin de kullandığı bu terim, verilerin anlamlandırılmasında kilit rol oynar.
  10. Bilgi Piramidi: Piramit; sembollerden oluşan “Veri”, veri işlemeden doğan “Enformasyon”, öğrenme ve yeniden şekillendirmeyi içeren “Bilgi” ve keşfetme/muhakeme içeren “Bilgelik” katmanlarından oluşur. Büyük veri sembollerden parçalara ulaşma gibi bir içerikle tanımlanmaz.

——————————————————————————–

Bölüm 3: Kompozisyon Soruları

Aşağıdaki sorular, konunun derinlemesine analiz edilmesi amacıyla hazırlanmıştır. Yanıtlar metindeki verilere dayanmalıdır.

  1. Büyük veri teknolojileri ile kullanılan fonksiyonellik-araç eşleşmelerini (Sorgu dili, veri işleme, görselleştirme, veri ambarı, istatistik) analiz ederek, Tableau ve Weka gibi araçların bu ekosistemdeki yerini tartışınız.
  2. Dünya üzerindeki açık veri girişimlerini (OKI, OGP, OD4D, GODI) göz önüne alarak, açık verinin küresel ölçekte nasıl bir kurumsal ağ tarafından yönetildiğini ve izlendiğini değerlendiriniz.
  3. Veri sorumlularının anonimleştirme yöntemlerini uygularken dikkate alması gereken beş temel özelliği (çeşitlilik, fayda, nicelik, büyüklük, aktarılacak tarafın özellikleri) ve bu özelliklerin veri güvenliği üzerindeki etkilerini inceleyiniz.
  4. Semantik webin temel hedeflerini (veritabanı entegrasyonu, paylaşılabilir veri tabanları, servis oluşturma vb.) göz önünde bulundurarak, bu teknolojinin internetteki veri alışverişini nasıl dönüştürmeyi amaçladığını açıklayınız.
  5. Büyük verideki kaygı unsurlarını (gizlilik, mahremiyet, güvenlik, ayrımcılık) tanımlayarak, bu kaygıların veri sınıflandırma yöntemleri (Karanlık veri, gri veri, hassas veri) ile olan ilişkisini kurgulayınız.

——————————————————————————–

Bölüm 4: Temel Terimler Sözlüğü

TerimTanım
AnonimleştirmeKişiye doğrudan veya dolaylı erişimi önlemek amacıyla verinin paylaşılabilir hale getirilmesi işlemi.
Açık VeriTelif hakkı bulunmayan, herkesin kullanımına ve dağıtımına açık, nitelik standartlarına bağlı veri.
Bilgelik (Wisdom)Bilgi piramidinin en üstünde yer alan; keşfetme, buluş, muhakeme ve değer içeriklerini kapsayan katman.
Data MartOrganizasyon içinde belirli bir kullanıcı grubunun (örneğin İK) özel ihtiyaçları için tasarlanmış veri yapısı.
EnformasyonVerinin işlenmesi, düzenlenmesi ve raporlanması sonucunda ortaya çıkan anlamlı içerik.
Hassas VeriSigorta, banka, tapu ve eğitim verileri gibi, mahremiyet kapsamında korunması gereken özel veriler.
Karanlık Veri (Dark Data)Sınıflandırılmış veri gruplarından biri olan, genellikle toplanan ancak işlenmeyen veya kullanılmayan veriyi ifade eder.
Makine Öğrenimiİlk kez Arthur Samuel tarafından ortaya atılan, büyük verinin tarihsel gelişiminde kritik öneme sahip terim.
OntolojiSemantik webin temel bileşeni; varlıkların ve ilişkilerinin tanımlanması.
Semantik WebDağıtık web servisleri ve entegre veritabanları oluşturmayı hedefleyen, verinin anlamlandırılmasına dayalı web yapısı.
Veri MaskelemeVerinin güvenliğini sağlamak amacıyla deterministik, dinamik veya statik yöntemlerle gizlenmesi.
Yapısal Olmayan VeriBüyük veride yapı açısından “Yapısal” ve “Yarı Yapısal” dışında kalan, belirli bir formatı olmayan veri sınıfı.

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top