NASIL ÇALIŞIR
Verinizden sonuca giden hat
Belge, veri tabanı, API — kaynağınız ne olursa olsun: parçala, embed et, indexle, sorgula, üret. Her adımda gözlemlenebilirlik ve geri besleme.
- IngestPDF, SQL, Web, S3, Confluence, SharePoint
- EmbedOpenAI, Cohere, BGE, kendi modeliniz
- IndexHNSW + metadata filter + hybrid
- RetrieveReranker + MMR + query rewriting
- GenerateGuardrails + citations + streaming
ÖRNEK SORGU
> "Son çeyrekte EBITDA neden düştü?"
→ 2.3s · 4 sources · %97 güven
MODÜLLER
Her AI mimarisi için sahaya hazır
RAG Pipeline
Verilerinizi LLM'lere bağlayan üretim-seviyesinde Retrieval Augmented Generation. Doküman parçalama, embedding, yeniden sıralama ve hallucination kontrolü tek hat üzerinde.
Vektörel Veritabanı
Milyarlarca embedding'i milisaniyelerde sorgulayın. pgvector, Pinecone, Weaviate ve Verihane'in yerel HNSW motoruyla tam uyumlu.
Çoklu LLM Yönlendirme
GPT-4, Claude, Llama, Mistral, kendi modelleriniz. Maliyet, gecikme ve doğruluğa göre otomatik yönlendirme.
Knowledge Graph
Yapılandırılmamış verilerinizi ilişkisel bilgi grafiklerine dönüştürün. Varlık çıkarımı, ilişkilendirme ve graf sorgulamaları.
Semantik Arama
Anahtar kelime değil anlam ile arama. Hibrit BM25 + dense retrieval, çoklu dil desteği.
Veri Yönetişimi
PII maskeleme, satır seviyesi politika, denetim izi. Her prompt ve cevap kayıt altında.
VEKTÖREL VERİTABANI
Milyarlarca embedding.
Milisaniye sorgu.
Verihane Vector altında HNSW + IVF-PQ + skalar quantization. Hibrit arama (BM25 + dense), metadata filtreleri ve tenant izolasyonu yerelinde.
p99 < 8ms
gecikme
10B+
vektör/cluster
99.99%
SLA
# Vektör sorgu örneği
from verihane import VectorClient
vc = VectorClient(index="docs-prod")
results = vc.search(
query="how to reduce churn",
embedding=embed("how to reduce churn"),
filters={"department": "growth"},
rerank=True,
k=8,
)
for r in results:
print(r.score, r.text[:80])