Büyük Veri (Big Data) Nedir ?)

 

Büyük Veri, geleneksel veritabanı sistemlerinin kapasitesini aşan veridir. Günümüzde veri çok büyük, çok çeşitli, çok hızlı yer değiştiriyor ve geleneksel veritabanı sistemlerinin altyapısına sığmıyor.

Kısacası Büyük Veri, geleneksel yazılımlarla yönetilemeyecek, saklanmayacak, analiz edilemeyecek kadar  büyük ve karmaşık veridir. Bu sebeple alternatif yollara başvurmamız gerekir. Büyük Veri burada devreye girer.

V+ Büyük Veri çözümlerinde, müşterilerimizin ihtiyaçlarına göre çözümler sunmaktayız.

Büyük verinin saklanması ve yönetilmesinin yanında tüketici eğilimlerini dinamik şekilde öngörebilmek, büyük veriyi analiz edebilmekten ve bu analizlere göre hareket edebilmekten geçiyor. Büyük Veri, geleneksel veritabanı araçları ve algoritmaları ile işlemesi zor olan bu büyük verinin oluşturulması, saklanması, akışı, analiz edilmesi gibi birçok konuyu içeren bir terim olarak karşımıza çıkmaktadır. Veriler klasik veritabanlarının kaldıramayacağı büyüklükte olduğu gibi verinin büyüme hızı da bir bilgisayar veya bir veri depolama ünitesini aşmaktadır. 2012 rakamları ile dünyada günlük 2.5 kentirilyon byte veri üretilmektedir. Bu çapta büyük veriyi işleme, transfer etme gibi işlerin tümüne Büyük Veri (Big Data) adı verilmektedir.

Büyük Veri Çözümleriyle İlgili İş Ortaklarımız / Markalarımız / Ürünlerimiz

V+ büyük veri çözümlerinde aşağıdaki marka, ürün ve iş ortaklıklarıyla hizmet sunmaktadır:

IBM, Teradata

Detaylı Bilgi

Büyük Veri, Veri üretme, depolama, veriyi çekme ve analiz etme üzerine dayalıdır.

Bunlar 3 başlık altında toplanabilir;

Hacim, Hız ve Çeşitlilik

Hacim

Günümüzde sıradan bir PC 500 GB - 1 TB arası veri saklar. Facebook üzerinde her gün 500 TB civarı veri oluşuruluyor. Bir uçak tek bir seferde yaklaşık 250 TB uçuş verisi oluşturuyor. Günümüzde akıllı telefonlar herkeste var ve sürekli sosyal medya verisi (video, fotoğraf) oluşturuyorlar. Bunların yanısıra gömülü sensörler bir çok cihazda bulunmakta ve bunlar her saniye çevre, konum bilgisi gibi bir çok veri üretiyor. Tüm bunları düşününce verini büyüklüğünü tahmin etmek zor değil.

Hız

Hızın bize en çok gerekli olduğu yer şüphesiz borsa. Piyasa çok değişken ve akışkan. Her saniye veriler bir kaç defa değişebiliyor. Bu değişikliklerin eş zamanlı olarak taşınması piyasa namına çok önemli. Eğlence sektöründe de durum farklı değil. Günümüz çevrimiçi oyunlarında milyonlarca oyuncu aynı anda sisteme bir çok veri aktarıyor. Bu sebeple hız çok önemli.

Çeşitlilik

Veri bir çok çeşitte olabilir. Her çeşit veri tek tip veritabanı üzerinde aynı verimlilik/performansta çalışmaz. Video, resim verileri farklı veritabanı ortamlarında, metin tabanlı dosyalar farklı veritabanlarında daha iyi performans gösterirler. Bu sebeple büyük verinin işlenmesinde veri çeşitliliğini göz önünde bulundurmak gerekir. Büyük Veri teknolojileri sayesinde çeşitli türden veriler en uygun veritabanlarında çalışıp bize zaman kazandırırlar.

Büyük verideki en önemli konulardan bir tanesi de verinin analiz edilebilmesidir. Daha önce analiz ettiğimiz veriler genellikle yapısal (structured) veri. Yeni veri kaynakları ise yapısal olmayan (unstructured). Yapısal verinin de yapısal olmayan verinin de bir formatı var aslında. Yapısal olmayan veri öyle şekli şemali belli olmayan veri demek değil. Yapısal veride siz veri için bir alan ayırırsınız, ve bu alandaki verinin de olduğunu da bilir ve kontrol edersiniz. Örneğin şehir isimlerini tutacağınız bir alan olsun, 50 karakter yer ayırırsınız, daha önemlisi bu alanın içindeki verinin şehir ismi olduğunu bilirsiniz. İşte verinin yapısal olup olmaması bu alanın içinde ne olduğunu bilip bilmediğinizle ilgilidir. Yoksa bir Twitter mesajı 140 karakterden oluşur. İşte size yapısı, ancak Twitter mesajları yapısal olmayan veri olarak tanımlanır çünkü siz 140 karakter olduğunu bilirsiniz ama içinde ne olduğunu bilemezsiniz. Bu yüzden mailler, sosyal medya mesajları gibi birçok veri kaynağı yapısal olmayan veri sınıfına girerler.

Bu veriler bizim analiz etmeye alışık olmadığımız tiptedir, ancak veri artık bu tipte üretilmektedir ve analiz edilebilir hale gelmesi bize çok önemli bilgiler sağlayabilecektir.

Büyük veri ile geleneksek veri arasındaki farkları aşağıdaki tabloda görebilirsiniz.

 

Untitled

Bilgilendirici ek belge ve bağlantılar: