Data deduplication allows for saving storage space by storing only one copy of repeated data in blocks or files. Today, due to usage habits, the same data is stored in multiple places using different methods, which increases storage costs. For example, sending a work file via email to dozens of people and storing it in different folders on file servers can be considered. (The size of a file, 30mb, held in a personal email account can reach 7GB depending on the frequency and type of backup).
Aynı şekilde yedekleme işlemleri sırasında da tekrarlanan veriler oldukça fazladır (İşletim sistemi dosyaları ve farklı klasörler de saklanmış olan dosya kopyaları).
Veri tekilleştirme Inline veya post-process olarak 2 farklı şekilde çalışmaktadır:
Detaylı bilgi ve talepleriniz için bizimle iletişime geçebilirsiniz: İletişim sayfası için tıklayın.
Veri Tekilleştirme Hakkında Detaylı Bilgi
Basit anlamda “De-duplication”, verilerin sabit (fixed) ya da değişken (variable) büyüklüklerde parçalara bölünerek yedeklenmesi işlemidir. Aynı parçaların (identical segments) tek kopyası tutulur ve gerçek veri için linkler oluşturulur. De-duplication Block (byte/bit) seviyesinde yapıldığı takdirde daha iyi sonuçlar alınabilir.
Amaç: Büyük miktarlardaki verilerin daha küçük alanlarda depolanmasını sağlamak.
Faydaları:
Ne kadar Faydalı?
Örnek Hesaplama:
Yedeklenmek istenen toplam veri : 2 TB
Veri tipi : %50 kullanıcı dosyaları / %50 veri tabanları
Günlük ortalama değişim : %10
Yedekleme politikası : Her gün tüm veriler
Yedeklerin saklanma süresi : 90 gün
Diske yedeklemede kullanılan 1 TB alanın maliyeti : 1.000 USD
Normal bir yedekleme yaklaşımı ile bu kurumda yedekleme için 180 TB’lık alana ihtiyaç duyulmaktadır. Tekilleştirme kullanıldığında ise 38’e 1 oranında tekilleştirme yapılarak, yaklaşık 5 TB’lik bir alanda 90 günlük veri saklanabilir. Bu hesapla tam 175 TB’lık bir alandan tasarruf edilir; bu da yaklaşık 175.000 USD’lık bir yatırım tasarrufuna karşılık gelmektedir.
Nasıl çalışıyor?
Yedeklenecek olan veri parçalara ayrılarak önceden yedeklenmiş veri ile karşılaştırılır. Bu karşılaştırma sonucunda aynı olan veriler için referans oluşturulur, farklı olan veriler diske yazılır.
Çalışma Şekilleri:
Genelde 3 noktada de-duplication yapılmaktadır: