28 Nisan 20265 dk okuma

AIGENCY V4: 128 Milyar Parametre, Multimodal Yetenek ve Türkçe için Küresel Referans

AIGENCY V4: 128 Milyar Parametre, Multimodal Yetenek ve Türkçe için Küresel Referans

27 Nisan 2026 — eCloud Yazılım Teknolojileri, AIGENCY ailesinin doğrudan ardılı olan AIGENCY V4'ü üretime aldı. V3'ün dört bağımsızlık ilkesini koruyan, 120 milyar parametreli yerli metin çekirdeğine 8 milyar parametreli yerli vision encoder eklenen V4, toplam 128 milyar parametre ile multimodal yetenek kazandı. Bu yazıda lansmanın teknik, stratejik ve operasyonel sonuçlarını özetliyoruz.

Tek Cümlede Konum

AIGENCY V4 — Türkçe okuma anlama ve doğal dil çıkarımında dünya lideri, fen muhakemesi ve grade-school matematikte frontier seviyesinde, multimodal ve graduate-level bilim uzmanlığında geliştirme aşamasında bir yerli yapay zekâ modeli.

1. Üç Katmanlı Yetenek Haritası

AIGENCY V4'ün küresel manzaradaki konumu üç farklı yetenek katmanında ayrı ayrı değerlendirilmelidir. Tek bir 'genel sıralama' yanıltıcıdır; model her katmanda farklı bir konum tutar.

Türkçe Okuma & NLI — Dünya Lideri

  • Belebele-TR 87.33 — anadil okuma anlama, frontier yayını yok
  • TQuAD 82.40 — Türkçe extractive QA
  • TR-MMLU 70.80 — Türkçe akademik
  • XNLI-TR 73.40 — doğal dil çıkarımı
  • TR Grammar 79.00 — dilbilgisi

Fen Muhakemesi & Matematik — Frontier Seviyede

  • ARC-Challenge 94.88 — frontier ile aynı bantta (GPT-5 ~96, Claude 4.6 ~96, Gemini 3 Pro ~95)
  • GSM8K 94.62 — grade-school matematikte tepe segment (GPT-5 96.8, Gemini 3 Pro ~94, DeepSeek V4 92.6)

Kod Üretimi — Üst-Orta Frontier

  • HumanEval 84.15 / HumanEval+ 79.88
  • MBPP 84.82 / MBPP+ 78.04
  • IFEval (strict) 80.22 — talimat takibi
  • TruthfulQA MC1 76.38 — halüsinasyon direnci

Multimodal — İlk Üretim Sürümü

  • DocVQA 79.17, ChartQA 67.68
  • MMMU 53.33, MathVista 34.13
  • Türkçe altyazılı 8 milyon görsel ile fine-tune edilmiş 8B yerli vision encoder

2. V3'ten V4'e Stratejik Geçiş

V4'ün geliştirme felsefesi V3'ün getirdiği bağımsızlık iddialarını korumak ve üzerine multimodal yetenekleri inşa etmektir. Üç hedef belirlenmiştir:

  1. Çoklu görsel-girdi modaliteleri ekleyerek küresel multimodal değerlendirmelerde rekabet etmek.
  2. V3'ün Türkçe-spesifik liderliğini multimodal alana taşımak (Türkçe altyazılı görseller, hukuki belge taramaları, akademik şekiller).
  3. V3'te tanımlı eğitim ve operasyon altyapısını değiştirmeden — sadece vision encoder'ı yan modül olarak — entegre etmek.

3. Mimari Yenilikler

3.1 Vision Encoder (V4 yeni bileşen)

eCloud bünyesinde sıfırdan tasarlanmış YerLi-ViT-H mimarisi, 24 katman, hidden size 1280, native 384×384 piksel çözünürlük, 16×16 patch boyutu, 576+1 [CLS] görsel token. Cross-modal projection 1280 → 2048 → 4096 boyutuna projekte ederek metin çekirdeğine bağlanır. Eğitimin son %5'i Türkçe altyazılı 8M görselle yapıldı; ön değerlendirmede Türkçe metin-görsel ilişkilendirmede %12 daha iyi sonuç alındı.

3.2 V3'ten Devralan Optimizasyon Yığını

OptimizasyonParametreBellekLatency
Adaptif LoRA+%11%7%5
Selective Layer Collapse%9%6%3
Yerelleştirilmiş MoE (L-MoE)%18
4-bit blok kuantizasyon%45%73%12
Öbekli dikkat%28%21
NET ETKİ (V3 baseline)%14.9%62.4%42

3.3 Hiyerarşik Bellek Mimarisi (HBM)

Üç katmanlı kalıcı bellek: STM (4K, AES-256-XTS), ITM (64K, AES-256-XTS), LTM (278K, ChaCha20-Poly1305 + TPM-sealed). TG-Decay zaman-rehberli eskime ile yönetilir. Frontier modellerde yalnızca KV-cache var; AIGENCY V4 oturumlar arası kalıcı bağlamı 4.3× daha geniş bir pencerede tutar.

4. Değerlendirme Metodolojisi

Her sonuç Wilson 95% güven aralığı ile raporlandı. Toplam 13.344 gerçek API çağrısı, 22 farklı benchmark, deterministik (temperature=0.0) koşullarda alındı. AIGENCY ailesinin yayımlanmış en kapsamlı tek-seans değerlendirmesidir.

  • API endpoint: https://aigency.dev/api/v2
  • Asistan slug: alparslan-v4
  • Konkürans: 4–10 paralel worker
  • Backoff: 1s → 2s → 4s → 8s → 16s, 6 deneme
  • Subsample seed: 42

5. Güvenlik, Uyum ve Post-Quantum Hazırlık

STM/ITM RAM'de AES-256-XTS, LTM diskte ChaCha20-Poly1305 + TPM-sealed per-record key. Görsel önbellek (V4 yeni) 30 MB sınır + 24h TTL. Diferansiyel gizlilik: özet istatistik raporu ε=3.0, log-tabanlı kullanım grafiği ε=5.0, otomatik fine-tune geri beslemesi ε=7.5.

Uyum: KVKK §5/§12, ISO/IEC 27001, ETSI EN 303 645, NIST SP 800-207 (Zero-Trust), EU AI Act (yüksek-risk sınıfı, model kart). Post-quantum geçiş 2026/Q2'de aktif: LTM şifreleme XChaCha-Kyber1024 hybrid.

6. Stratejik Kullanım — 8 Sektör

V4'ün skor profili rastgele değil; 8 sektörde uygulanır anlatıya çevrilir:

  • P0 — Kamu / Devlet: KVKK §5/§12, e-Devlet entegrasyonu, 4M+ kararname Q&A, 20M karar derlemi.
  • P0 — Hukuk & LegalTech: İçtihat arama, sözleşme risk taraması, müvekkil özet brifing.
  • P0 — Bankacılık & Finans: KYC belge anlama, Türkçe risk raporu, BDDK uyum.
  • P1 — Eğitim & Yükseköğretim: YKS/LGS hazırlık, Türkçe ders asistanı, akademik makale tarama.
  • P1 — Sağlık: Hasta dosyası özeti, SGK kod eşleme (idari/dokümantasyon).
  • P1 — Savunma & Kritik Altyapı: Yurt içi DC zorunlu alanlar.
  • P2 — Medya & Yayıncılık: TR Grammar 79.00 + RLHF Türkçe kalibrasyon.
  • P2 — Yazılım & AR-GE: HumanEval 84.15 + 278K bağlam ile büyük kod tabanı analizi.

7. Bilinen Kısıtlar (Şeffaflık)

Bilimsel itibarın temeli, eksiklerin gizlenmemesidir.

  • GPQA Diamond 37.88 ve MMLU-Pro 50.20: frontier'in 35–50pp gerisinde. V4.1'de Türk üniversiteleriyle akademik veri kaynağı genişletme planı var.
  • Multimodal ilk sürüm: MMMU 53.33, MathVista 34.13 — frontier vision modellerinden 20–40pp altta.
  • Latency frontier'in 2–3 katı: avg 9.55s, p95 32.77s. V4.1 hedefi: avg 4s, p95 15s.
  • Multimodal güvenlik filtresi false-positive: V4.0.0 %10–15 → V4.0.1 hotfix ile %2.

8. Yol Haritası

  • V4.1 (2026/Q4): Vision encoder 8B → 16B, Türkçe vision-text derlem 240GB → 600GB, MMLU-Pro 0.65, GPQA 0.55, latency avg 4s.
  • V4.2 (2027/Q1): Çoklu görsel modu (8 görsel/istek), video kabul (60s, 2 FPS), yerli ASR ile speech-to-text.
  • V5 (2027/Q3): Heterojen hızlandırıcılar (GPU+ASIC+FPGA), Hiyerarşik MoE, continual learning, post-quantum tam uyum.

9. Açık Kaynaklaştırma

Eğitim hattı (Apache-2.0, 2026/Q3), HBM/CCW referans (AGPL-3.0, 2026/Q4), Vision encoder referans (AGPL-3.0, 2027/Q1), Cross-modal projection (AGPL-3.0, 2027/Q1), Router-Bus & Adapter API (MPL-2.0, 2026/Q4), Benchmark altyapısı (MIT, 2026/Q3). Akademik denetime salt-okunur erişim mevcuttur.

Sonuç

AIGENCY V4, Türkçe için tasarlanmış, küresel olarak rekabetçi, tam-bağımsız bir yapay zekâ modelinin teknik olarak mümkün olduğunu, üretim ortamında istikrarlı çalıştığını ve şeffaf değerlendirmeyle doğrulanabildiğini gösterir. Bağımsız bilim, üretimde.

Tam teknik whitepaper'ı whitepaper sayfasında inceleyebilir, PDF'i Türkçe ya da İngilizce indirebilirsiniz.