NORA (Non-Obvious Relationship Awareness) Görülmez İlişki Farkındalığı

Yazan : Şadi Evren ŞEKER

Bu yazının amacı literatürde kısaca NORA olarak geçen ve İngilizce Non-Obvsious Relationship Awareness kelimelerinin baş harflerinden oluşan ve Türkçe’ye görülmez ilişki (bağlantı) farkındalığı olarak çevrilebilecek olan kavramı açıklamaktır.

Kavram basitçe, birden fazla veri kaynağı kullanılarak, veri kaynaklarının tek başına çıkarım için yeterli olmadığı sonuçlara ulaşmayı hedefler. İlk başlarda, terörist grupları veya suç örgütlerini bulmak gibi amaçlarla literatüre girmiş olsa da günümüzde gerek ekonomik gerek sosyal çok farklı amaçlarla kullanılmaktadır.

Örnek:

Bir kullanıcının bir seyahat sitesinde Antalyadaki tatilleri arattığını düşünelim. Bu kullanıcının Facebook üzerinden eşi olarak belirlediği kişinin girmiş olduğu yemek sitesinde, Antalyadaki tatiller ile ilgili ilanların gösterilmesi basit bir NORA uygulamasıdır.

NORA uygulamasını çeşitli kara liste uygulamalarında da görebiliriz. Örneğin kumarhanelerin, kart saymak veya hile yapmak ile ünlenmiş oyuncular ile ilgili listeleri tutmaları ve bu listeler üzerinde NORA uygulaması yaptığı bilinen bir gerçektir. Buna göre hile yapan kişi ile aynı cep telefonu numarasına sahip olan (isim değiştirme ihtimaline veya takma isimlere karşı), kişilerin de kumarhanelerde çalıştırılmasının yasaklanması gibi uygulamalar bulunmaktadır. Bu konuda güncel tutulan 18 farklı listeden hile yapma potansiyeli bulunan oyuncular takip edilmektedir.

NORA ile ilgili meseleler:

Veri çoğu zaman iyi kategorize edilmiş ve yapısallaştırılmış halde bulunmaz. Bu durum her ne kadar çalışmayı zorlaştırsa da çoğu zaman NORA çalışmaları için bir avantaj oluşturur. Çünkü sizin bulmak istediğiniz bilgiye kötü niyetli kişilerin erişmesi de güçleşmiş olur. Şayet bir NORA çalışması tamamen deşifre olursa, kötü niyetli kişilerin buna karşı önlemler alması ihtimali artar.

Veriniz zamanla daha akıllı hale gelir. Verinin üzerinde çalıştıkça ve veri kümeniz arttıkça sizin çıkarımlarınızı sağlama imkanınız ve dolayısıyla daha başarılı sonuçlara ulaşma imkanınız artar.

Kısmı bilgi genelde yeterlidir. Genelde yapılan iş gözetimli (supervised) sonuçlar çıkarmak olduğu için, beklenen sonuç ve ulaşma şekli genelde önceden tanımlanır. Bu durum, tanımlı olan sonuçlara çok hızlı ulaşılmasını sağlamaktadır.

Daha fazla veri her zaman iyidir. Güncel bir konu olan büyük veri (big data) kavramı, her ne kadar işleme açısından sorunlar oluştursa da, sonuca ulaşmak için geçen zamanı azaltır. Bunun basit bir sebebi vardır. Normalde veri büyüdükçe elde edeceğiniz bağlantılar daha yoğun ve daha doğrudan olacaktır. Örneğin 5 farklı veri kaynağındaki verilerin sadece yarısını alarak elde edebileceğiniz bir bağlantı yerine, bir veya iki veri kaynağının tamamını alarak ulaşmanız mümkündür. Bu yüzden veri kaynaklarınızın büyümesi genelde sonuçlara daha hızlı ulaşılmasını sağlar.

Sayılabilirlik önemlidir. Literatürde sayılabilirlik (countability, cardinality) olarak geçen kavram, bilgisayar işlemelerinde büyük bir öneme sahiptir. Örneğin kişiler, vakalar, işlemler gibi sayılabilir veriler her zaman tercih edilir. Bu verilerin üzerinden vektör elde etmek ve işlemek mümkündür. Buna karşılık sayılamayan değerler (mesela bir kişinin ne kadar tatil yapmak isteyebileceği, veya bir kurumun ne kadar kaliteli olduğu gibi) ise işlemede her zaman daha fazla yük ve bazı durumlarda sonuca ulaşamamak gibi problemler doğurur.

Kişilik hakları önemlidir ancak bir engel değildir. Kişisel bilgiler ile işlem yapılırken kişilik haklarını ihlal etmeme yolları (örneğin özet fonksiyonları (hashing) gibi) yanında çoğu kullanıcının kişisel bilgiler konusunda hassas olmadığı da görülmüştür (örneğin sırf bu amaçla yazılan bir oyunun, son kullanıcı sözleşmesinde açıkça bütün bilgilerinizi alıp her türlü amaçla kullanacağız yazmasına rağmen çoğu kullanıcının bunu okumadan onayladığı görülmüştür).

Kötü niyetli kişilerin de akıllı olabileceğini unutmamak gerekir. Genelde uygulanan yöntemler ve çıkarımlar belirli bir zaman sonra kötü niyetli kişiler tarafından da fark edilmekte ve buna karşı önlem alınmaktadır. Aradaki bu zaman teknolojinin de yardımı ile her geçen gün daha da azalmakta ve hayat daha da hızlanmaktadır. Bunun için kullanılan yöntemlerin açıklanmaması ve saklı tutulması büyük önem taşımakta ayrıca kullanım alanına göre kullanıcılara rahatsızlık vermeyecek seviyede tutulması gerekmektedir.

 

 

Leave a Reply


+ 2 = beş