Egemen.
Multimodal.
128B parametre.
Türkçe okuma anlama ve doğal dil çıkarımında küresel referans. Fen muhakemesi ve grade-school matematikte frontier seviyede. Multimodal kabiliyette ilk üretim sürümü.
AIGENCY V4 — bir bakışta
27 Nisan 2026 tarihinde 13.344 gerçek API çağrısı ile yapılan kapsamlı değerlendirmenin sonuçları. V3'ün dört bağımsızlık ilkesi (dış parametre sıfırlama, yerel veri egemenliği, şeffaf belgeleme, Türkçe morfolojik bağlam uyumu) korunarak; multimodal yetenek (görsel girdi anlama, belge soru-cevap, grafik ve matematik görseli yorumlama) eklenmiştir.
- Belebele-TR 87.33% — global referans
- TQuAD 82.40% — extractive QA
- TR-MMLU 70.80% — Türkçe akademik
- XNLI-TR 73.40% — doğal dil çıkarımı
- TR Grammar 79.00% — dilbilgisi
- ARC-Challenge 94.88% — frontier seviyesinde eşit
- GSM8K 94.62% — grade-school matematikte tepe
- Frontier modellerle aynı bantta
- HumanEval 84.15%, HumanEval+ 79.88%
- MBPP 84.82%, MBPP+ 78.04%
- Talimat takibi: IFEval (strict) 80.22%
- Halüsinasyon direnci: TruthfulQA MC1 76.38%
- MMMU 53.33%, ChartQA 67.68%
- DocVQA 79.17%, MathVista 34.13%
- 8B parametreli yerli vision encoder
- Türkçe altyazılı 8M görsel ile fine-tune
Tek Cümle Konumlandırma
AIGENCY V4 — Türkçe okuma ve doğal dil çıkarımında dünya lideri, fen muhakemesi ve grade-school matematikte frontier seviyesinde, multimodal ve graduate-level bilim uzmanlığında geliştirme aşamasında bir yerli yapay zekâ modeli.
Üç bileşenli modüler tasarım
AIGENCY V4 üç ana bileşenden oluşur: V3'ten devralan 120B metin çekirdeği, V4'te eklenen 8B yerli vision encoder, ve cross-modal projection ile bunları birleştiren hierarchical memory bus. Görsel akışı isteğe bağlı tutar; metin yolu hiç bozulmaz.

Metin Çekirdeği — 120B
V3'ten devralan 120 milyar parametreli yerli çekirdek. Adaptif LoRA+, Selective Layer Collapse, Yerelleştirilmiş Mixture-of-Experts (L-MoE), 4-bit blok kuantizasyon ve öbekli dikkat optimizasyonları korundu.
Vision Encoder — 8B (V4 Yeni)
eCloud bünyesinde sıfırdan tasarlanmış 8.2 milyar parametreli yerli vision encoder. YerLi-ViT-H, 24 katman, 384×384 piksel native çözünürlük. Türkçe altyazılı 8 milyon görsel ile fine-tune edildi.
Cross-Modal Projection
Vision encoder çıktısı, 2-katmanlı MLP ile metin çekirdeğinin embedding boyutuna projekte edilir: 1280 → 2048 → 4096. GeLU + LayerNorm aktivasyonu görsel-metin hizalamasını korur.
Hiyerarşik Bellek (HBM)
Üç katmanlı kalıcı bellek: STM (4K token, AES-256-XTS), ITM (64K token, AES-256-XTS), LTM (278K token, ChaCha20-Poly1305 + TPM-sealed). TG-Decay zaman-rehberli eskime ile yönetilir.
V3'ten Devralan Optimizasyon Yığını
V3'te tanımlanan ve doğrulanan beş optimizasyon tekniği V4'te değiştirilmeden korundu. Bu sürekliliğin amacı, multimodal eklemenin çekirdek metin performansına regresyon yaratmamasını garantilemektir.
2.1
Adaptif LoRA+

Bağlamsal yoğunluk metriği eşik altına düşerse başlık LoRA güncellemesinden çıkarılır; eşik üstünde adaptif rank genişlemesi uygulanır.
2.2
Selective Layer Collapse

Klasik katman pruning yerine, kanal çıktıları üzerinde spektral kümeleme uygulanır; kümeler birleştirilir ve QR-faktörizasyon ile yeniden ortonormalize edilir.
2.3
Yerelleştirilmiş MoE (L-MoE)

Geleneksel MoE her giriş için global uzman havuzundan seçim yapar; L-MoE yönlendirmesi kullanıcı-görev vektörü ve uzman görev imzasının softmax skoruyla hesaplanır.
2.4
4-bit Blok Kuantizasyon
![w_q = round(w / α) ∈ [−7, 7]](/whitepaper-v4/equations/eq04_quant.png)
Ağırlık tensörleri 64-elemanlı bloklara ayrılır; her blok için minimum-maksimum eşikleme ile dönüştürülür. Ağırlık alanı %75 küçülür (22 GB → 6 GB).
2.5
Öbekli Dikkat (Chunked Attention)

Uzun bağlam penceresinde O(n²) bellek ve zaman maliyetini düşürmek için n uzunluğundaki dizi b öbeğe bölünür; her öbek içinde tam dikkat hesaplanır.
278K token, 3 katmanlı bellek, denetlenebilir silme
Contextual Core-Wrapping (CCW) giriş akışını atomik bağlam küreleri haline getirir; çeşitlenmiş recursive attention ile hiyerarşik dikkat hesaplanır. Hiyerarşik Bellek Mimarisi (HBM) STM/ITM/LTM üçlü katmanını TG-Decay zaman-rehberli eskime ile yönetir.

Anlık (last 90s), FIFO + yoğunluk < 0.05 silme
Oturumluk, görev kimliği eşleşmesi, ağırlıklı LRU
Kalıcı, user 'remember' işareti, TPM-sealed per-record key
Ölçülebilir Kazanımlar (V2 → V4)
- Anlamsal sapma (çok-belgeli)%4.3 → %0.9
- Oturum içi unutma%3.1 → %0.7
- Bağlam pencere sınırı64K → 278K (4.3×)
- Bellek arama süresi (avg)34 ms → 18 ms
Denetlenebilir Bellek İşlemleri
Bellek öğesi mⱼ için kimlik imzası SHA-256(mⱼ ‖ ts) ile tutulur. DELETE /aigency/memory/forget?id= çağrısı kimlik doğrulamasıyla uçtan uca izlenir; silinen öğe audit log'da hash olarak saklanır.
DELETE /aigency/memory/forget?id=<sha-256>Görsel akışı opsiyonel, iki adımlı API protokolü
V4'ün AIGENCY ailesine getirdiği en büyük yenilik multimodal yetenektir. Kullanıcı önce text-only newChat ile chat_id alır, ardından sendMessage ile görsel multipart olarak gönderilir. attachements alan adı sunucu tarafında orijinal yazımıyla korunmaktadır (V3 API uyumluluğunu kırmamak için).

Görsel-Metin Eğitim Derlemi (240 GB / 7.5M çift)
- Türkçe altyazılı görseller92 GB · 4.2 M
- Hukuki belge taramaları (anonim)56 GB · 0.8 M
- Akademik şekiller ve grafikler48 GB · 1.6 M
- Anatomik ve tıbbi görüntüler30 GB · 0.4 M
- Sentetik OCR ve grafik14 GB · 0.5 M
Multimodal Güvenlik Filtresi
Pre-Encoding
SHA-256 hash blocklist; Lightweight vision classifier (350M parametre): NSFW, şiddet, IP-ihlali, kişisel veri tespiti.
Post-Encoding
Cross-modal output kontrol: model yanıtı zararlı içerik üretmeye yönelirse (toxicity classifier eşiği aşılırsa) yanıt kesilir.
V4.0.0 false-positive %10–15 → V4.0.1 hotfix ile %2'ye indirildi (aktif kalibrasyon).
Multimodal Benchmark Sonuçları
| Benchmark | AIGENCY V4 | Claude Opus 4.7 |
|---|---|---|
| DocVQA | 79.17 | 93.8 |
| ChartQA | 67.68 | 88.2 |
| MMMU | 53.33 | 84.1 |
| MathVista | 34.13 | 79.3 |
1.826 GB Türkçe-öncelikli derlem, GPG-imzalı boru hattı
128 NVIDIA H100 80GB GPU üzerinde NVLink 4 ile özgün ZeNO-3 (Zero-Redundancy Node-Optimised) algoritması kullanılarak eğitildi. Veri ön işleme: GPUDirect Storage + Zstandard sıkıştırma (1-pass, ratio ≈ 2.4).
Veri Kaynakları (Metin)
| Kategori | Boyut | Belge sayısı |
|---|---|---|
| Türkçe kitap & makale | 680 GB | 3.1 M |
| Hukuk-mevzuat derlemi | 412 GB | 20 M |
| Web forum & Q/A (TR) | 312 GB | 5.4 M |
| Kod havuzları (Py, JS) | 210 GB | 42 M snippet |
| Bilimsel veri (TR-EN) | 155 GB | 0.8 M |
| Sentetik diyalog | 57 GB | 1.9 M |
| TOPLAM | 1,826 GB | 73.2 M |
Ön Yargı Tespit & Azaltma
- • TOXTR-Score: Türkçe toksik sözcük listesi + Vector Toxicity
- • DEBIAN-Fair: DP_abs < 0.04 demografik eş dağılım hedefi
- • Rel-Bias: Dini/etnik çağrışım kavram sıklığı
- • HateXplain-TR FPR < %1.2
- • TOXTR ortalama 0.031 (hedef ≤ 0.035)
- • Demografi TPR oranı (F/M) = 0.97
RLHF ve Davranışsal Ayar
Türkçe veri ile yeniden kalibre edildi; ortalama tercih oranı V4'te %73.
- • 54 etik + 37 yazılım + 18 görsel hizalama = 109
- • Çift sütun yöntemi: yanıt (A/B) eşleştirmesi
- • Bradley-Terry skoru → ödül modeli
13.344 gerçek API çağrısı, deterministik koşullar
Her sonuç Wilson 95% güven aralığı ile raporlanmıştır. Tüm deneyler aynı API endpoint'i, asistan slug'ı ve seed altında çalıştırılmıştır.
Eşit Koşul Sağlama Protokolü
- Sıcaklık
- 0.0 (deterministik)
- Top-p
- Devre dışı (greedy)
- Max yanıt token
- Modelin doğal sınırı
- Konkürans
- 4-10 paralel worker
- Backoff
- 1s → 2s → 4s → 8s → 16s
- Subsample seed
- 42
Wilson 95% Güven Aralığı

p: gözlemlenen oran; n: örneklem büyüklüğü. Binom için normal yaklaşımdan daha sağlamdır; küçük n'de bile daralmadan kalır.
22 Benchmark — 4 Kategori
Akademik
- MMLU
- MMLU-Pro
- ARC-Challenge
- HellaSwag
- WinoGrande
- GPQA Diamond
Matematik & Kod
- GSM8K
- MathVista
- HumanEval
- HumanEval+
- MBPP
- MBPP+
Doğruluk & Talimat
- TruthfulQA MC1
- IFEval (strict)
Türkçe & Multimodal
- TR-MMLU
- XNLI-TR
- TQuAD
- TR Grammar
- Belebele-TR
- MMMU
- ChartQA
- DocVQA
Frontier modellerle yan yana, 22 benchmark
Wilson 95% güven aralığıyla raporlanan tam sonuç tablosu. AIGENCY V4 ARC-C ve GSM8K'da frontier seviyede; kod üretiminde üst-orta segment; GPQA-D ve MMLU-Pro'da geliştirme aşamasında.

Tier 1 — Kritik Karşılaştırma
| Benchmark | AIGENCY V4 | GPT-5 | Claude 4.6/4.7 | Gemini 3 Pro | Konum |
|---|---|---|---|---|---|
| GSM8K | 94.62 | 96.8 | ~96 | ~94 | Frontier (eşit) |
| ARC-Challenge | 94.88 | ~96 | ~96 | ~95 | Frontier (eşit) |
| HellaSwag | 88.60 | ~95 | ~94 | ~94 | 6pp altta |
| MBPP | 84.82 | ~92 | ~91 | ~88 | 7pp altta |
| HumanEval | 84.15 | 94.0 | 95.0 | 89.7 | 11pp altta |
| IFEval (strict) | 80.22 | ~90 | ~86 | ~85 | 6pp altta |
| MMLU | 80.10 | 94.2 | 88-93 | 92.4 | 12pp altta |
| HumanEval+ | 79.88 | ~91 | ~89 | ~85 | 9pp altta |
| MBPP+ | 78.04 | ~86 | ~84 | ~81 | 6pp altta |
| TruthfulQA MC1 | 76.38 | ~81 | ~77 | ~75 | Eşit |
| WinoGrande | 74.66 | ~88 | ~86 | ~82 | 11pp altta |
| MMLU-Pro | 50.20 | ~85 | ~84 | ~81 | Geliştirme alanı |
| GPQA Diamond | 37.88 | 88-94 | 91.3-94.2 | 91.9 | Geliştirme alanı |
Türkçe-spesifik
Frontier yayınlanmadığından — fiili küresel referans
| Benchmark | Doğruluk | n |
|---|---|---|
Belebele-TR Anadil okuma anlama | 87.33 | 900/900 |
TQuAD (F1≥0.5) Türkçe extractive QA | 82.40 | 500/500 |
TR Grammar Türkçe dilbilgisi | 79.00 | 100/100 |
XNLI-TR Doğal dil çıkarımı | 73.40 | 500/500 |
TR-MMLU Türkçe akademik | 70.80 | 500/500 |
Tier 2 — Orta Hacim
Stratified subsample (n=1000)
| MMLU | 0.8010 | [0.775, 0.825] |
| MMLU-Pro | 0.5020 | [0.471, 0.533] |
| HellaSwag | 0.8860 | [0.865, 0.904] |
| WinoGrande XL | 0.7466 | [0.722, 0.770] |
| HumanEval+ | 0.7988 | [0.731, 0.853] |
| MBPP+ | 0.7804 | [0.736, 0.819] |
Operasyonel Performans

| Metrik | Değer | Hedef |
|---|---|---|
| Toplam API çağrısı (test) | 13,344 | — |
| Persistent error oranı | %0.3 | %1 |
| Avg latency | 9.55 s | 6 s |
| p50 latency | 4.39 s | 3 s |
| p95 latency | 32.77 s | 25 s |
| p99 latency | 33.59 s | 30 s |
| Otomatik iyileşme başarı | %98.4 | %97 |
| Kaos testi başarı | %100 | %99 |
Çekirdek aynı, multimodal eklendi
V3 (2025/Q1) AIGENCY ailesinin LLAMA3 bağımlılığından arınmış ilk sürümüydü. V4'ün geliştirme felsefesi V3'ün getirdiği bağımsızlık iddialarını koruyup üzerine multimodal yetenekleri inşa etmektir.

| Optimizasyon | Parametre | Bellek | Latency | Not |
|---|---|---|---|---|
| Adaptif LoRA+ | %11 | %7 | %5 | V3'ten korundu |
| Selective Layer Collapse | %9 | %6 | %3 | V3'ten korundu |
| Yerelleştirilmiş MoE | — | — | %18 | Aktif uzman ↓ |
| 4-bit blok kuantizasyon | %45 | %73 | %12 | Ağırlık depolama |
| Öbekli dikkat | — | %28 | %21 | Uzun bağlamda |
| Vision encoder (yeni) | +%6.7 | +2.1 GB | +~3s/img | V4 ek |
| NET ETKİ | %14.9 | %62.4 | %42 | Metin akışı, V3 baseline |
Çok katmanlı şifreleme, post-quantum hazırlık
Bellek, model parametreleri ve görsel önbellek dahil tüm katmanlarda dinlenirken ve aktarımda şifreleme. KVKK, ISO/IEC 27001, ETSI EN 303 645, NIST SP 800-207, EU AI Act uyumu.
Bellek Şifreleme Mimarisi
| Katman | Şifreleme | Not |
|---|---|---|
| STM/ITM (RAM) | AES-256-XTS | RAM'den swap edilmez |
| LTM (disk) | ChaCha20-Poly1305 | PFS, per-record key, TPM-sealed |
| Model parametreleri | AES-256-GCM | Oturum-içi tek kullanımlık anahtar, HW-RNG |
| Görsel önbellek (V4 yeni) | AES-256-GCM + HKDF-SHA-512 | 30 MB sınırı, 24h TTL |
Post-Quantum Hazırlık
| Modül | PQ | Tarih |
|---|---|---|
| Bellek şifreleme (LTM) | XChaCha-Kyber1024 hybrid | 2026/Q2 |
| Model kartı imzası | Falcon-1024 | 2026/Q3 |
| API mTLS | SIKE-p503 fallback | 2026/Q4 |
Veri minimizasyonu, şifreleme, erişim log'u
BT-ISMS, risk & kontrol matrisi
IoT API kimlik doğrulama
Zero-Trust: mTLS, minimum yetki, sürekli izleme
Yüksek-risk sınıfı, model kart
Görseller 24h sonra otomatik silinir
Diferansiyel Gizlilik
Özet istatistik raporu ε=3.0 (Laplace gürültü); Log-tabanlı kullanım grafiği ε=5.0 (Exponential mekanizma); Otomatik fine-tune geri beslemesi ε=7.5 (Subsample-and-Aggregate).
Skor profili → 8 sektörde uygulama
AIGENCY V4'ün küresel değer önermesi tek cümlede: Türkçe içerik üzerinde çalışan, KVKK uyumlu ve veri-egemen olması gereken, uzun belge işlemeyi gerektiren her kurumsal yapay zekâ iş yükü için varsayılan tercih. Sektör seçimi rastgele değildir — her sektör V4 skorlarıyla doğrudan haklılaştırılmıştır.
Kamu & Devlet
P0KVKK §5/§12 uyumu, Türkiye DC barındırma, GPG-imzalı şeffaf eğitim hattı, Belebele-TR 87.33 / TQuAD 82.40 ile Türkçe metin işlemede #1.
- Bakanlık içi belge soru-cevap (4M+ kararname)
- Vatandaş hizmet asistanı (e-Devlet entegrasyonu)
- Yargı destek (20M karar derlemi)
- İhale şartname analizi
Hukuk & LegalTech
P0Yargıtay, Danıştay, AHM, Resmi Gazete, TBMM zabıtları — 20M karar + mevzuat derlemi dünyada eşi olmayan veri tabanı.
- İçtihat arama ve emsal karar bulma
- Sözleşme risk taraması (XNLI-TR 73.40)
- Müvekkil özet brifing (RLHF Türkçe ton)
- Mahkeme kararı sınıflandırma
Bankacılık & Finans
P0Türkçe-yoğun KYC/AML belgeleri, BDDK uyum metinleri, Türkçe sözleşmeler — KVKK-yerel barındırma şart.
- KYC belge anlama (TR Grammar 79.00 + ChartQA 67.68)
- Risk raporu Türkçe özetleme
- Sözleşme uyum kontrolü (DocVQA 79.17)
- Müşteri hizmet asistanı
Eğitim & Yükseköğretim
P1TR-MMLU 70.80, MMLU 80.10, GSM8K 94.62, TR Grammar 79.00 — Türkçe eğitim için frontier dışı en iyi profil.
- Lise/üniversite ders asistanı
- YKS/LGS hazırlık platformları
- Türkçe yazılım eğitimi (HumanEval 84.15)
- Akademik makale tarama
Sağlık & Hastane Sistemleri
P1KVKK + sağlık verisi hassasiyeti → tam yerli zorunlu. 30 GB anatomik/tıbbi görsel eğitim verisi (hasta-onamlı).
- Hasta dosyası özeti (Türkçe anamnez)
- SGK kod eşleme
- Klinik araştırma protokolü çeviri
- İlaç prospektüsü redaksiyonu
Savunma & Kritik Altyapı
P1'Frontier dışı seçenek olamaz' diyen alan — yurt dışı barındırma, kapalı kaynak, denetimsiz model olamaz.
- İstihbarat raporu Türkçe özet
- Lojistik ve tedarik analizi
- Türkçe etkileşim eğitim simülasyonu
- Açık kaynak kod denetimi
Medya & Yayıncılık
P2Türkçe yazım kuralları, deyim/atasözü hassasiyeti, editoryal ton — TR Grammar 79.00 + RLHF Türkçe kalibrasyon = profesyonel yayın kalitesi.
- Haber redaksiyonu
- Türkçe altyazı / dublaj script üretimi
- Yayıncılık metin redaksiyonu (278K bağlam)
- Kurumsal iletişim Türkçe redaktör
Yazılım & AR-GE
P2HumanEval 84.15 / MBPP+ 78.04 → frontier üst-orta segment kod yetkinliği. 278K bağlam ile büyük kod tabanı analizi.
- Kod inceleme asistanı (Türkçe açıklama)
- Dokümantasyon üretimi (TR-EN çift)
- API spec → istemci kodu
- Eski sistem (legacy) Türkçe yorum-temizleme
Bilimsel itibarın temeli: eksiklerin gizlenmemesi
Bu beyaz kitap, V4'ün güçlü taraflarını sunmanın yanı sıra zayıf yanlarını ve kısıtlarını da şeffaf belirtir. V4.1 yol haritası bu alanları ana iyileştirme öncelikleri olarak tanımlamıştır.
GPQA Diamond ve MMLU-Pro
GPQA Diamond 0.379 ve MMLU-Pro 0.502, frontier modellerinin gerisindedir (35-50pp). Sebep: V4'ün graduate-level fizik, kimya, biyoloji uzman eğitim verisinin yetersizliği. V4.1 yol haritasında Türk üniversiteleriyle akademik veri kaynağı genişletme programı planlanmıştır.
Multimodal Yetenekler İlk Sürüm
MMMU 0.533, MathVista 0.341, ChartQA 0.677 — frontier vision modellerinden 20-40pp altta. V4.1 hedefi: vision encoder 8B → 16B, Türkçe-spesifik vision-text derlem 240GB → 600GB.
Latency Frontier'in 2-3 Katı
V4 ortalama 9.55s, p95 32.77s. Frontier modelleri 3-5s ortalama, p95 8-12s. Sebep: vision encoder ek yükü, cross-modal projection, multimodal güvenlik filtresi.
Multimodal Güvenlik Filtresi False-Positive
V4.0.0'da %10-15; aktif kalibrasyonla V4.0.1'de %2'ye indirildi.
V4.1 → V4.2 → V5: somut iyileştirme hedefleri
V4.1
2026/Q4- Vision encoder 8B → 16B parametre, 24 → 32 katman
- Türkçe-spesifik vision-text derlem 240 GB → 600 GB
- MMLU-Pro hedefi: 0.50 → 0.65
- GPQA Diamond hedefi: 0.38 → 0.55
- Latency: avg 9.55s → 4s, p95 32.77s → 15s
V4.2
2027/Q1- Çoklu görsel modu (tek istekte 8 görsele kadar)
- Video kabul (60s klipler için 2 FPS frame-sampling)
- Speech-to-text entegrasyonu (yerli ASR)
V5
2027/Q3- Heterojen yapay zekâ hızlandırıcıları (GPU + ASIC + FPGA)
- Hiyerarşik MoE (H-MoE)
- Continual learning (Elastic Replay Buffer)
- Post-quantum tam uyum
Akademik denetime açık, modüler yayınlama
Eğitim hattı, HBM/CCW referansları, vision encoder ve cross-modal projection — adım adım açık kaynak yayınlanacak. PII redaksiyonu hariç tüm boru hattı 2026/Q3'ten itibaren akademik denetime açıktır.
| Bileşen | Lisans | Yayın |
|---|---|---|
| Eğitim boru hattı | Apache-2.0 | 2026/Q3 |
| HBM/CCW referans | AGPL-3.0 | 2026/Q4 |
| Vision encoder referans | AGPL-3.0 | 2027/Q1 |
| Cross-modal projection | AGPL-3.0 | 2027/Q1 |
| Router-Bus & Adapter API | MPL-2.0 | 2026/Q4 |
| Benchmark altyapısı | MIT | 2026/Q3 |
Bağımsız bilimin kanıtı
AIGENCY V4 — eCloud Yazılım Teknolojileri'nin V3 ile başlattığı tam-bağımsız yerli yapay zekâ ailesinin multimodal yetenek kazandırılmış doğrudan ardılıdır. 27 Nisan 2026 tarihinde 13.344 gerçek API çağrısı ve Wilson 95% güven aralığıyla raporlanan değerlendirme, V4'ün küresel manzaradaki konumunu net biçimde ortaya koymuştur.
Türkçe için tasarlanmış, küresel olarak rekabetçi, tam-bağımsız bir yapay zekâ modelinin teknik olarak mümkün olduğunu, üretim ortamında istikrarlı çalıştığını ve şeffaf değerlendirmeyle doğrulanabildiğini gösterir.