NEDEN ÇOK VERİ?
Bir agent, gördüğü kadar akıllıdır.
Generatif AI, regresyon değil — istatistiksel temsil öğrenir. Yani modelin sektörünüzdeki örüntüleri kavraması için yeterli vaka, sözcük dağarcığı ve uç durumla karşılaşması gerekir.
Bir bankanın 6 aylık işlem verisinin kapsamı; bir LLM'i fraud tespitinde uzmanlaştırmaya yetmez. 6 yıllık, 6 ülkeden, 60 kanaldan akan veri ise modelin "anlam"ı yakalamasına izin verir.
Ama veri büyüdükçe yönetimi de zorlaşır. İşte burada modern bir veri lake gereksinim oluyor: ölçeklenebilir, ucuz, açık formatlı, AI-native bir temel.
ÖNCESİ & SONRASI
Verihane öncesi. Verihane sonrası.
Eski yaklaşım
- ✕Veriler 12+ silo arasında dağılmış
- ✕Şema sürümleri uyumsuz, ETL çakışıyor
- ✕AI ekibi veriye ulaşmak için haftalar bekliyor
- ✕Maliyet kontrolsüz büyüyor
- ✕Yönetişim ve denetim eksik
Verihane yaklaşımı
- ✓Tek kaynak, açık formatlar (Iceberg/Delta)
- ✓Şema evrimi, zaman yolculuğu, geri alma
- ✓AI agent'ları saniyeler içinde sorgular
- ✓Sorgu-bazlı ücretlendirme, otomatik tier-down
- ✓Sütun-seviyesi lineage + tek katlı politika
KATMAN MİMARİSİ
Bronz → Gümüş → Altın → AI
Bronze
Ham
Tüm kaynaklar, değişmeden, append-only.
Silver
Temiz
Birleştirilmiş, doğrulanmış, normalize edilmiş.
Gold
İş
Domain modelleri, KPI'lar, semantik katman.
AI
Hazır
Embedding'ler, feature store, RAG index.