11 Mart 2015

Bir “Büyük Veri” Yazısı Da Benden Olsun (Dört Köşe #31, Mart 2015)

Kulakları çınlasın, bugünlerde büyük bir sistem entegratörü firmada teknoloji gurubu lideri olan arkadaşımla sohbet ediyorduk 3 sene kadar önce. “Büyük Veri’nin geleceği konusunda ne düşünüyorsun?” diye sorduğumda “tabi dosyalar çok büyüdü artık, Blu-Ray diskler filan, dosya sistemleri bunlarla baş edemiyor” gibi bir cevap vermişti. Çok bozuntuya vermeyip geçmiştim; 2012 başları pek çok insan için İngilizce’si Big Data olan Büyük Veri kavramının yeni yeni duyulmaya başladığı zamanlardı.

Aslında Büyük Veri için bu tarz algıda olanların haklı da bir mazereti de var. Hangi firma Büyük Veri hakkında bir sunum yapmaya kalksa, ilk başta “efendim son 2 yılda bilmem kaç zettabayt veri üretildi; her gün şu kadar exabayt veri üretiliyor” gibi bir yansı üzerinden muhabbete başlıyor. E, gerisini dinlemezseniz de aklınızda kalan tek konu saklama büyüklüğü oluyor.

Elbette ki nicel büyüklük de Büyük Veri kavramını oluşturan niteliklerden bir tanesi. Ancak depolama alanının büyüklüğü üzerinden yapılan hesapların gözden kaçırdığı bir şey var. 1 dakikalık video verisi bundan 5 yıl önce standart çözünürlükte 5 MB tutuyorduysa bugün yüksek çözünürlüğün yaygınlaşması ile 25 MB tutuyor. Ama o veri hala 1 dakikalık video; işlev olarak içerdiği bilgi çok da farklı değil.


Veri Hacmi olarak saydığımız bu niteliğin yanı sıra Veri Çeşitliliği, Veri Hızı, Veri Değişkenliği, Veri Doğruluğu ve Veri Karmaşıklığı kavramları bir araya gelerek Büyük Veri’yi oluşturuyor. Yıllardır veri yönetiminde kullandığımız veritabanı sistemleri ile Büyük Veri’yi ayırt eden özellikler bunlar.

Düşününce bu saydığımız altı öğenin de varlığı bizi çok da şaşırtmıyor. Veri Hacmi’nin depolama kapasitesinden bahsettik; ancak tekil veri adedinin artışı ile ilgili neredeyse hiçbir bilgi yok. Bu da aslında biraz Veri Çeşitliliği’nden kaynaklanıyor. Özellikle Nesnelerin İnternet’i kavramının hayatımıza girmesi ile adının başında “akıllı” sıfatı taşıyan her cihaz, endüstri, sağlık vb. sektörlerde kullanılan özel amaçlı cihazlar, internet üzerinde veri üretme konusunda her biri sosyal medya canavarına dönüşmüş biz insanlara eşlik ediyor.

Üretilen verilerin hızı, Büyük Veri ile yapacağınız çalışmalara yön veriyor. Ancak bu kadar çok veri üreten olduğunda aynı obje için birbiri ile uymayan veriler olabiliyor. Veri Değişkenliği dediğimiz de bu zaten. Bir de üretilen verinin gerçekten ölçülen, gözlemlenen değerler olduğunun garanti edilmesi lazım. Veri Doğrulu’ğunun sağlanması yapılacak analizin doğruluğunda önemli bir faktör.

Elde edilen tüm bu verilerin depolanması, birbiriyle ilişkilendirilmesi gibi nizam-intizam işleri de Veri Karmaşıklığı yönetimi ile sağlanıyor.

Özellikle veri yönetimi üzerinde iş yapan teknoloji firmaları Büyük Veri kavramı ile ilgili yaptıkları pazarlama çalışmaları ile bu konuyla ilgili farkındalık ve pazar oluşturma çabasındalar. Çoğu kurumsal yapı da bu rüzgarla konuyla ilgili yatırım hazırlıkları yapıyor.

Yine de bazılarının kaçırdığı bir nokta var sanki. Büyük Veri kavramı da Sanallaştırma gibi bir şey aslında. Tek başına pek bir anlamı yok. “Herkes Büyük Veri projesi yapıyor, ben de yapayım” yaklaşımı ile yola çıkılan pek çok proje zaten kurum elinde bulunan mevcut veri yönetim sistemlerine farklı bağlantı noktalarından veri aktarmaktan öteye gidemiyor. Bu da zaten zor yönetilen kurumsal veri kaynaklarını iyice çorbaya çeviriyor.

Ancak adını koyduktan sonra da size verdiği gerçekten çok tatminkar Büyük Veri teknolojilerinin. Sayısız kaynaktan elde ettiğiniz veriler ile güvenliik, müşteri yönetimi, ürün yönetimi, karar destek uygulamaları gibi alanlarda kurumsal yapıların verimli adımlar atmasında önemli bir stratejik araç.

Aslında her proje ve teknoloji için söylemek de mümkün bunu, ancak Büyük Veri üzerinde de bıçağı doğru tutarsanız ekmek kesiyorsunuz. Yanlış tutarsanız, Allah korusun.

Bu yazı daha sonra düzenlenerek Telekom Dünyası'nın 151. sayısında yayınlanmıştır.

Hiç yorum yok:

Yorum Gönder