Veri Gölü (Data Lake – DL) ve Veri Ambarı (Data Warehouse – DWH) Arasındaki Fark Nedir?

Günümüzde şirketler, ham veriyi işleyerek daha anlamlı ve kullanışlı hale getirmek için İş Zekası kavramına büyük bir önem vermektedirler. Bu kavram, stratejik kararlar alma ve süreç geliştirme konusunda uzun zamanlı analizlerde kullanılarak şirketler için en uygun trendlerin ve fırsatların tanımlanmasında yardımcı olan tekniklerin bütünüdür. Kısacası, hazırladığımız grafik, tablo veya haritaları tek başına kullanmaktan çıkararak, birbirleri arasında ilişki kurmamıza yardımcı olur ancak ham verilerin stratejik kararlara dönüştürülebilmesi için öncelikle bazı kavramların anlaşılması gerekmektedir.

Gelin birlikte bu kavramlardan iki tanesini detaylı bir şekilde inceleyelim.

Veri Ambarı (DWH) Nedir?

Veri Ambarı, verilerin stratejik anlamda kullanılmasına yardımcı olan ve süreç içinde farklı teknolojik yapılar – bileşenler kullanılan bir sistemdir. Anlamlı iş ön görüleri sağlamak, çeşitli kaynaklardan veri toplamak ve yönetmek için bir teknik olarak da kullanılmaktadır.

İşlem işleme yerine sorgulama ve analiz için tasarlanmış bir işletme tarafından büyük miktarda bilginin elektronik olarak depolanması ve veriyi bilgiye dönüştürme sürecidir.

Veri Ambarı (DWH) Konsepti

Veri Ambarı verileri stratejik kararlar almak için verileri düzenlemeye ve kullanmaya yardımcı olan dosya veya klasörlerde saklar. Bu depolama sistemi aynı zamanda atomik ve özet verilerin çok boyutlu bir görünümünü verir.

  • Veri Çıkarma (Data Extraction)
  • Veri Temizleme (Data Cleansing)
  • Veri Dönüşümü (Data Transformation)
  • Veri Yükleme ve Yenileme (Data Load & Refresh)

Bu işlemi gerçekleştirmek için gerekli olan önemli işlevlerdir.

Veri Gölü (DL) Nedir?

Veri Gölü, büyük miktarda yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış veriyi depolayabilen bir depolama havuzudur. Hesap boyutu veya dosyasında sabit sınırlar olmaksızın her tür veriyi yerel biçiminde depolayabileceğiniz bir yerdir. Analitik performansı ve yerel entegrasyonu artırmak için yüksek veri miktarı sunar.

Veri Gölü, gerçek göl ve nehirlere çok benzeyen büyük bir konteyner gibidir. Tıpkı bir gölde birden fazla kolunuz olduğu gibi, bir Veri Gölü yapılandırılmış verilere, yapılandırılmamış verilere, makineden makineye, gerçek zamanlı olarak akan günlüklere sahiptir.

Veri Gölü(DL) Konsepti

Bir Veri Gölü, ihtiyaç duyulana kadar orijinal biçiminde, büyük miktarda ham veri tutan büyük boyutlu bir depolama kutusudur. Veri Gölündeki her veri öğesine benzersiz bir tanımlayıcı verilir ve bir dizi genişletilmiş meta veri etiketi ile etiketlenir. Bu işlem ise çok çeşitli analitik yetenekler sunar.

Veri Gölü (DL) ve Veri Ambarı (DWH) arasındaki temel farklar nelerdir?

No alt text provided for this image

 

Kısacası tüm bunları özetlersek;

  • Veri Gölü, kaynaktan ve yapısından bağımsız olarak tüm verileri depolarken, Veri Ambarı verileri nitelikleriyle nicel metriklerde saklar.
  • Veri Gölü, büyük yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış verileri depolayan bir depolama deposudur. Veri Ambarı ise verilerin stratejik olarak kullanılmasına izin veren teknolojilerin ve bileşenlerin bir karışımıdır.
  • Veri Gölü, verileri depoladıktan sonra şemayı tanımlarken, Veri Ambarı verileri depolamadan önce şemayı tanımlar.
  • Veri Gölü, ELT (Extract Load Transform) işlemini kullanırken, Veri Ambarı ETL (Extract Transform Load) işlemini kullanır.
  • Veri Gölü, derinlemesine analiz yapmak isteyenler için idealken, Veri Ambarı operasyonel kullanıcılar için idealdir.
Share this post:
Share on facebook
Facebook
Share on twitter
Twitter
Share on telegram
Telegram
Share on whatsapp
WhatsApp