AIGENCY V4Üretimde

CC BY-ND 4.0eCloud Yazılım Teknolojileri

Egemen.
Multimodal.
128B parametre.

Türkçe okuma anlama ve doğal dil çıkarımında küresel referans. Fen muhakemesi ve grade-school matematikte frontier seviyede. Multimodal kabiliyette ilk üretim sürümü.

PDF · Türkçe PDF · English Belgeyi keşfet

128B

Toplam Parametre

120B çekirdek + 8B vision encoder

278K

Bağlam Penceresi

Token (Hiyerarşik Bellek)

13,344

Benchmark Ölçümü

Gerçek API çağrısı, 22 benchmark

Wilson 95%

Güven Aralığı

Deterministik subsample

01Yönetici Özeti

AIGENCY V4 — bir bakışta

27 Nisan 2026 tarihinde 13.344 gerçek API çağrısı ile yapılan kapsamlı değerlendirmenin sonuçları. V3'ün dört bağımsızlık ilkesi (dış parametre sıfırlama, yerel veri egemenliği, şeffaf belgeleme, Türkçe morfolojik bağlam uyumu) korunarak; multimodal yetenek (görsel girdi anlama, belge soru-cevap, grafik ve matematik görseli yorumlama) eklenmiştir.

Türkçe Okuma & NLI — Dünya Lideri

Belebele-TR 87.33% — global referans
TQuAD 82.40% — extractive QA
TR-MMLU 70.80% — Türkçe akademik
XNLI-TR 73.40% — doğal dil çıkarımı
TR Grammar 79.00% — dilbilgisi

Fen Muhakemesi & Matematik — Frontier

ARC-Challenge 94.88% — frontier seviyesinde eşit
GSM8K 94.62% — grade-school matematikte tepe
Frontier modellerle aynı bantta

Kod Üretimi — Üst-Orta Frontier

HumanEval 84.15%, HumanEval+ 79.88%
MBPP 84.82%, MBPP+ 78.04%
Talimat takibi: IFEval (strict) 80.22%
Halüsinasyon direnci: TruthfulQA MC1 76.38%

Multimodal — İlk Üretim Sürümü

MMMU 53.33%, ChartQA 67.68%
DocVQA 79.17%, MathVista 34.13%
8B parametreli yerli vision encoder
Türkçe altyazılı 8M görsel ile fine-tune

Tek Cümle Konumlandırma

AIGENCY V4 — Türkçe okuma ve doğal dil çıkarımında dünya lideri, fen muhakemesi ve grade-school matematikte frontier seviyesinde, multimodal ve graduate-level bilim uzmanlığında geliştirme aşamasında bir yerli yapay zekâ modeli.

02Model Mimarisi

Üç bileşenli modüler tasarım

AIGENCY V4 üç ana bileşenden oluşur: V3'ten devralan 120B metin çekirdeği, V4'te eklenen 8B yerli vision encoder, ve cross-modal projection ile bunları birleştiren hierarchical memory bus. Görsel akışı isteğe bağlı tutar; metin yolu hiç bozulmaz.

Şekil 3 — Görsel girdi vision encoder'a, metin doğrudan core'a yönlendirilir; cross-modal projection iki akışı birleştirir. HBM kalıcı belleği yönetir.

Metin Çekirdeği — 120B

V3'ten devralan 120 milyar parametreli yerli çekirdek. Adaptif LoRA+, Selective Layer Collapse, Yerelleştirilmiş Mixture-of-Experts (L-MoE), 4-bit blok kuantizasyon ve öbekli dikkat optimizasyonları korundu.

%14.9

Parametre tasarrufu

%62.4

Bellek tasarrufu

%42

Latency azalması

Vision Encoder — 8B (V4 Yeni)

eCloud bünyesinde sıfırdan tasarlanmış 8.2 milyar parametreli yerli vision encoder. YerLi-ViT-H, 24 katman, 384×384 piksel native çözünürlük. Türkçe altyazılı 8 milyon görsel ile fine-tune edildi.

576+1

Görsel token

1280

Hidden size

30 MB

Maks. dosya

Cross-Modal Projection

Vision encoder çıktısı, 2-katmanlı MLP ile metin çekirdeğinin embedding boyutuna projekte edilir: 1280 → 2048 → 4096. GeLU + LayerNorm aktivasyonu görsel-metin hizalamasını korur.

ℝ¹²⁸⁰

Giriş

ℝ²⁰⁴⁸

Ara

ℝ⁴⁰⁹⁶

Çıkış

Hiyerarşik Bellek (HBM)

Üç katmanlı kalıcı bellek: STM (4K token, AES-256-XTS), ITM (64K token, AES-256-XTS), LTM (278K token, ChaCha20-Poly1305 + TPM-sealed). TG-Decay zaman-rehberli eskime ile yönetilir.

STM

64K

ITM

278K

LTM

V3'ten Devralan Optimizasyon Yığını

V3'te tanımlanan ve doğrulanan beş optimizasyon tekniği V4'te değiştirilmeden korundu. Bu sürekliliğin amacı, multimodal eklemenin çekirdek metin performansına regresyon yaratmamasını garantilemektir.

2.1

Adaptif LoRA+

$C_t = ‖g_{t,k}‖₂ / Σ‖g_{t,k}‖₂$

Bağlamsal yoğunluk metriği eşik altına düşerse başlık LoRA güncellemesinden çıkarılır; eşik üstünde adaptif rank genişlemesi uygulanır.

%11

Parametre

Bellek (FP16)

Latency

2.2

Selective Layer Collapse

$ω_{i,j} = QR(merge(Wᵢ_clusters))$

Klasik katman pruning yerine, kanal çıktıları üzerinde spektral kümeleme uygulanır; kümeler birleştirilir ve QR-faktörizasyon ile yeniden ortonormalize edilir.

Parametre

Bellek

Latency

2.3

Yerelleştirilmiş MoE (L-MoE)

Geleneksel MoE her giriş için global uzman havuzundan seçim yapar; L-MoE yönlendirmesi kullanıcı-görev vektörü ve uzman görev imzasının softmax skoruyla hesaplanır.

4.0 → 2.1

Aktif uzman

−%47

Parametre erişimi

%18

Latency

2.4

4-bit Blok Kuantizasyon

Ağırlık tensörleri 64-elemanlı bloklara ayrılır; her blok için minimum-maksimum eşikleme ile dönüştürülür. Ağırlık alanı %75 küçülür (22 GB → 6 GB).

%73

Bellek

%45

Parametre alanı

%12

Latency

2.5

Öbekli Dikkat (Chunked Attention)

Uzun bağlam penceresinde O(n²) bellek ve zaman maliyetini düşürmek için n uzunluğundaki dizi b öbeğe bölünür; her öbek içinde tam dikkat hesaplanır.

%28

Bellek

%21

Latency

278K

Bağlam

03Bağlam İşleme: CCW + HBM

278K token, 3 katmanlı bellek, denetlenebilir silme

Contextual Core-Wrapping (CCW) giriş akışını atomik bağlam küreleri haline getirir; çeşitlenmiş recursive attention ile hiyerarşik dikkat hesaplanır. Hiyerarşik Bellek Mimarisi (HBM) STM/ITM/LTM üçlü katmanını TG-Decay zaman-rehberli eskime ile yönetir.

Şekil 4 — STM 4K, ITM 64K, LTM 278K. TG-Decay formülü her belleğin yaşam süresini yönetir.

STMtoken

4 000

Anlık (last 90s), FIFO + yoğunluk < 0.05 silme

AES-256-XTS

ITMtoken

64 000

Oturumluk, görev kimliği eşleşmesi, ağırlıklı LRU

AES-256-XTS

LTMtoken

278 000

Kalıcı, user 'remember' işareti, TPM-sealed per-record key

ChaCha20-Poly1305

Ölçülebilir Kazanımlar (V2 → V4)

Anlamsal sapma (çok-belgeli)%4.3 → %0.9
Oturum içi unutma%3.1 → %0.7
Bağlam pencere sınırı64K → 278K (4.3×)
Bellek arama süresi (avg)34 ms → 18 ms

Denetlenebilir Bellek İşlemleri

Bellek öğesi mⱼ için kimlik imzası SHA-256(mⱼ ‖ ts) ile tutulur. DELETE /aigency/memory/forget?id= çağrısı kimlik doğrulamasıyla uçtan uca izlenir; silinen öğe audit log'da hash olarak saklanır.

DELETE /aigency/memory/forget?id=<sha-256>

04Multimodal Yetenek Mimarisi

Görsel akışı opsiyonel, iki adımlı API protokolü

V4'ün AIGENCY ailesine getirdiği en büyük yenilik multimodal yetenektir. Kullanıcı önce text-only newChat ile chat_id alır, ardından sendMessage ile görsel multipart olarak gönderilir. attachements alan adı sunucu tarafında orijinal yazımıyla korunmaktadır (V3 API uyumluluğunu kırmamak için).

Şekil 5 — V4 multimodal API akışı. İki adımlı protokol: önce newChat ile chat_id, sonra sendMessage ile görsel multipart olarak gönderilir.

Görsel-Metin Eğitim Derlemi (240 GB / 7.5M çift)

Türkçe altyazılı görseller92 GB · 4.2 M
Hukuki belge taramaları (anonim)56 GB · 0.8 M
Akademik şekiller ve grafikler48 GB · 1.6 M
Anatomik ve tıbbi görüntüler30 GB · 0.4 M
Sentetik OCR ve grafik14 GB · 0.5 M

Multimodal Güvenlik Filtresi

Pre-Encoding

SHA-256 hash blocklist; Lightweight vision classifier (350M parametre): NSFW, şiddet, IP-ihlali, kişisel veri tespiti.

Post-Encoding

Cross-modal output kontrol: model yanıtı zararlı içerik üretmeye yönelirse (toxicity classifier eşiği aşılırsa) yanıt kesilir.

V4.0.0 false-positive %10–15 → V4.0.1 hotfix ile %2'ye indirildi (aktif kalibrasyon).

Multimodal Benchmark Sonuçları

Benchmark	AIGENCY V4	Claude Opus 4.7	Açıklama
DocVQA	79.17	93.8	Belge VQA (ANLS≥0.5)
ChartQA	67.68	88.2	Grafik soru-cevap (relaxed)
MMMU	53.33	84.1	Üniversite konuları
MathVista	34.13	79.3	Görsel matematik

05Eğitim Politikası ve Veri Kaynakları

1.826 GB Türkçe-öncelikli derlem, GPG-imzalı boru hattı

128 NVIDIA H100 80GB GPU üzerinde NVLink 4 ile özgün ZeNO-3 (Zero-Redundancy Node-Optimised) algoritması kullanılarak eğitildi. Veri ön işleme: GPUDirect Storage + Zstandard sıkıştırma (1-pass, ratio ≈ 2.4).

128 H100

GPU küme, NVLink 4

1,826 GB

Toplam metin derlemi

73.2 M

Belge sayısı

%72

Türkçe oranı

8 M

Türkçe altyazılı görsel

109

İnsan değerlendirici

Veri Kaynakları (Metin)

Kategori	Boyut	Belge sayısı	Lisans / Kaynak
Türkçe kitap & makale	680 GB	3.1 M	TÜBİTAK DergiPark
Hukuk-mevzuat derlemi	412 GB	20 M	Yargıtay, Danıştay, AHM, Resmi Gazete, TBMM
Web forum & Q/A (TR)	312 GB	5.4 M	Lisanslı kaynaklar
Kod havuzları (Py, JS)	210 GB	42 M snippet	E-CODE (MIT/Apache-2)
Bilimsel veri (TR-EN)	155 GB	0.8 M	Ulakbim açık erişim
Sentetik diyalog	57 GB	1.9 M	TR-TR tarz aktarımı
TOPLAM	1,826 GB	73.2 M

Ön Yargı Tespit & Azaltma

• TOXTR-Score: Türkçe toksik sözcük listesi + Vector Toxicity
• DEBIAN-Fair: DP_abs < 0.04 demografik eş dağılım hedefi
• Rel-Bias: Dini/etnik çağrışım kavram sıklığı
• HateXplain-TR FPR < %1.2
• TOXTR ortalama 0.031 (hedef ≤ 0.035)
• Demografi TPR oranı (F/M) = 0.97

RLHF ve Davranışsal Ayar

Türkçe veri ile yeniden kalibre edildi; ortalama tercih oranı V4'te %73.

• 54 etik + 37 yazılım + 18 görsel hizalama = 109
• Çift sütun yöntemi: yanıt (A/B) eşleştirmesi
• Bradley-Terry skoru → ödül modeli

06Değerlendirme Metodolojisi

13.344 gerçek API çağrısı, deterministik koşullar

Her sonuç Wilson 95% güven aralığı ile raporlanmıştır. Tüm deneyler aynı API endpoint'i, asistan slug'ı ve seed altında çalıştırılmıştır.

Eşit Koşul Sağlama Protokolü

Sıcaklık: 0.0 (deterministik)
Top-p: Devre dışı (greedy)
Max yanıt token: Modelin doğal sınırı
Konkürans: 4-10 paralel worker
Backoff: 1s → 2s → 4s → 8s → 16s
Subsample seed: 42

Wilson 95% Güven Aralığı

p: gözlemlenen oran; n: örneklem büyüklüğü. Binom için normal yaklaşımdan daha sağlamdır; küçük n'de bile daralmadan kalır.

22 Benchmark — 4 Kategori

Akademik

MMLU
MMLU-Pro
ARC-Challenge
HellaSwag
WinoGrande
GPQA Diamond

Matematik & Kod

GSM8K
MathVista
HumanEval
HumanEval+
MBPP
MBPP+

Doğruluk & Talimat

TruthfulQA MC1
IFEval (strict)

Türkçe & Multimodal

TR-MMLU
XNLI-TR
TQuAD
TR Grammar
Belebele-TR
MMMU
ChartQA
DocVQA

07Sonuçlar — 2026/Q2 Kıyaslama

Frontier modellerle yan yana, 22 benchmark

Wilson 95% güven aralığıyla raporlanan tam sonuç tablosu. AIGENCY V4 ARC-C ve GSM8K'da frontier seviyede; kod üretiminde üst-orta segment; GPQA-D ve MMLU-Pro'da geliştirme aşamasında.

AIGENCY V4 vs Frontier — Benchmark Karşılaştırması

Şekil 6 — V4 vs frontier 13 standart benchmark'ta yan yana. ARC-C ve GSM8K'da frontier seviyede; GPQA-D ve MMLU-Pro'da geride.

Tier 1 — Kritik Karşılaştırma

Benchmark	AIGENCY V4	GPT-5	Claude 4.6/4.7	Gemini 3 Pro	Konum
GSM8K	94.62	96.8	~96	~94	Frontier (eşit)
ARC-Challenge	94.88	~96	~96	~95	Frontier (eşit)
HellaSwag	88.60	~95	~94	~94	6pp altta
MBPP	84.82	~92	~91	~88	7pp altta
HumanEval	84.15	94.0	95.0	89.7	11pp altta
IFEval (strict)	80.22	~90	~86	~85	6pp altta
MMLU	80.10	94.2	88-93	92.4	12pp altta
HumanEval+	79.88	~91	~89	~85	9pp altta
MBPP+	78.04	~86	~84	~81	6pp altta
TruthfulQA MC1	76.38	~81	~77	~75	Eşit
WinoGrande	74.66	~88	~86	~82	11pp altta
MMLU-Pro	50.20	~85	~84	~81	Geliştirme alanı
GPQA Diamond	37.88	88-94	91.3-94.2	91.9	Geliştirme alanı

Türkçe-spesifik

Frontier yayınlanmadığından — fiili küresel referans

Benchmark	Doğruluk	n
Belebele-TR Anadil okuma anlama	87.33	900/900
TQuAD (F1≥0.5) Türkçe extractive QA	82.40	500/500
TR Grammar Türkçe dilbilgisi	79.00	100/100
XNLI-TR Doğal dil çıkarımı	73.40	500/500
TR-MMLU Türkçe akademik	70.80	500/500

Tier 2 — Orta Hacim

Stratified subsample (n=1000)

MMLU	0.8010	[0.775, 0.825]
MMLU-Pro	0.5020	[0.471, 0.533]
HellaSwag	0.8860	[0.865, 0.904]
WinoGrande XL	0.7466	[0.722, 0.770]
HumanEval+	0.7988	[0.731, 0.853]
MBPP+	0.7804	[0.736, 0.819]

Operasyonel Performans

Metrik	Değer	Hedef
Toplam API çağrısı (test)	13,344	—
Persistent error oranı	%0.3	%1
Avg latency	9.55 s	6 s
p50 latency	4.39 s	3 s
p95 latency	32.77 s	25 s
p99 latency	33.59 s	30 s
Otomatik iyileşme başarı	%98.4	%97
Kaos testi başarı	%100	%99

08V3 → V4 Evrimi

Çekirdek aynı, multimodal eklendi

V3 (2025/Q1) AIGENCY ailesinin LLAMA3 bağımlılığından arınmış ilk sürümüydü. V4'ün geliştirme felsefesi V3'ün getirdiği bağımsızlık iddialarını koruyup üzerine multimodal yetenekleri inşa etmektir.

Şekil 2 — Sol: maliyet profili (V3 baseline %100). Sağ: benchmark karşılaştırması — V4'te yeni standart paket.

Optimizasyon	Parametre	Bellek	Latency	Not
Adaptif LoRA+	%11	%7	%5	V3'ten korundu
Selective Layer Collapse	%9	%6	%3	V3'ten korundu
Yerelleştirilmiş MoE	—	—	%18	Aktif uzman ↓
4-bit blok kuantizasyon	%45	%73	%12	Ağırlık depolama
Öbekli dikkat	—	%28	%21	Uzun bağlamda
Vision encoder (yeni)	+%6.7	+2.1 GB	+~3s/img	V4 ek
NET ETKİ	%14.9	%62.4	%42	Metin akışı, V3 baseline

09Güvenlik, Uyum ve Kriptografik İşlevler

Çok katmanlı şifreleme, post-quantum hazırlık

Bellek, model parametreleri ve görsel önbellek dahil tüm katmanlarda dinlenirken ve aktarımda şifreleme. KVKK, ISO/IEC 27001, ETSI EN 303 645, NIST SP 800-207, EU AI Act uyumu.

Bellek Şifreleme Mimarisi

Katman	Şifreleme	Not
STM/ITM (RAM)	AES-256-XTS	RAM'den swap edilmez
LTM (disk)	ChaCha20-Poly1305	PFS, per-record key, TPM-sealed
Model parametreleri	AES-256-GCM	Oturum-içi tek kullanımlık anahtar, HW-RNG
Görsel önbellek (V4 yeni)	AES-256-GCM + HKDF-SHA-512	30 MB sınırı, 24h TTL

Post-Quantum Hazırlık

Modül	PQ	Tarih
Bellek şifreleme (LTM)	XChaCha-Kyber1024 hybrid	2026/Q2
Model kartı imzası	Falcon-1024	2026/Q3
API mTLS	SIKE-p503 fallback	2026/Q4

KVKK §5/§12

Veri minimizasyonu, şifreleme, erişim log'u

ISO/IEC 27001

BT-ISMS, risk & kontrol matrisi

ETSI EN 303 645

IoT API kimlik doğrulama

NIST SP 800-207

Zero-Trust: mTLS, minimum yetki, sürekli izleme

EU AI Act (2025)

Yüksek-risk sınıfı, model kart

Multimodal görsel KVKK

Görseller 24h sonra otomatik silinir

Diferansiyel Gizlilik

Özet istatistik raporu ε=3.0 (Laplace gürültü); Log-tabanlı kullanım grafiği ε=5.0 (Exponential mekanizma); Otomatik fine-tune geri beslemesi ε=7.5 (Subsample-and-Aggregate).

10Stratejik Kullanım

Skor profili → 8 sektörde uygulama

AIGENCY V4'ün küresel değer önermesi tek cümlede: Türkçe içerik üzerinde çalışan, KVKK uyumlu ve veri-egemen olması gereken, uzun belge işlemeyi gerektiren her kurumsal yapay zekâ iş yükü için varsayılan tercih. Sektör seçimi rastgele değildir — her sektör V4 skorlarıyla doğrudan haklılaştırılmıştır.

Kamu & Devlet

KVKK §5/§12 uyumu, Türkiye DC barındırma, GPG-imzalı şeffaf eğitim hattı, Belebele-TR 87.33 / TQuAD 82.40 ile Türkçe metin işlemede #1.

Bakanlık içi belge soru-cevap (4M+ kararname)
Vatandaş hizmet asistanı (e-Devlet entegrasyonu)
Yargı destek (20M karar derlemi)
İhale şartname analizi

Hukuk & LegalTech

Yargıtay, Danıştay, AHM, Resmi Gazete, TBMM zabıtları — 20M karar + mevzuat derlemi dünyada eşi olmayan veri tabanı.

İçtihat arama ve emsal karar bulma
Sözleşme risk taraması (XNLI-TR 73.40)
Müvekkil özet brifing (RLHF Türkçe ton)
Mahkeme kararı sınıflandırma

Bankacılık & Finans

Türkçe-yoğun KYC/AML belgeleri, BDDK uyum metinleri, Türkçe sözleşmeler — KVKK-yerel barındırma şart.

KYC belge anlama (TR Grammar 79.00 + ChartQA 67.68)
Risk raporu Türkçe özetleme
Sözleşme uyum kontrolü (DocVQA 79.17)
Müşteri hizmet asistanı

Eğitim & Yükseköğretim

TR-MMLU 70.80, MMLU 80.10, GSM8K 94.62, TR Grammar 79.00 — Türkçe eğitim için frontier dışı en iyi profil.

Lise/üniversite ders asistanı
YKS/LGS hazırlık platformları
Türkçe yazılım eğitimi (HumanEval 84.15)
Akademik makale tarama

Sağlık & Hastane Sistemleri

KVKK + sağlık verisi hassasiyeti → tam yerli zorunlu. 30 GB anatomik/tıbbi görsel eğitim verisi (hasta-onamlı).

Hasta dosyası özeti (Türkçe anamnez)
SGK kod eşleme
Klinik araştırma protokolü çeviri
İlaç prospektüsü redaksiyonu

Savunma & Kritik Altyapı

'Frontier dışı seçenek olamaz' diyen alan — yurt dışı barındırma, kapalı kaynak, denetimsiz model olamaz.

İstihbarat raporu Türkçe özet
Lojistik ve tedarik analizi
Türkçe etkileşim eğitim simülasyonu
Açık kaynak kod denetimi

Medya & Yayıncılık

Türkçe yazım kuralları, deyim/atasözü hassasiyeti, editoryal ton — TR Grammar 79.00 + RLHF Türkçe kalibrasyon = profesyonel yayın kalitesi.

Haber redaksiyonu
Türkçe altyazı / dublaj script üretimi
Yayıncılık metin redaksiyonu (278K bağlam)
Kurumsal iletişim Türkçe redaktör

Yazılım & AR-GE

HumanEval 84.15 / MBPP+ 78.04 → frontier üst-orta segment kod yetkinliği. 278K bağlam ile büyük kod tabanı analizi.

Kod inceleme asistanı (Türkçe açıklama)
Dokümantasyon üretimi (TR-EN çift)
API spec → istemci kodu
Eski sistem (legacy) Türkçe yorum-temizleme

11Bilinen Kısıtlar

Bilimsel itibarın temeli: eksiklerin gizlenmemesi

Bu beyaz kitap, V4'ün güçlü taraflarını sunmanın yanı sıra zayıf yanlarını ve kısıtlarını da şeffaf belirtir. V4.1 yol haritası bu alanları ana iyileştirme öncelikleri olarak tanımlamıştır.

GPQA Diamond ve MMLU-Pro

GPQA Diamond 0.379 ve MMLU-Pro 0.502, frontier modellerinin gerisindedir (35-50pp). Sebep: V4'ün graduate-level fizik, kimya, biyoloji uzman eğitim verisinin yetersizliği. V4.1 yol haritasında Türk üniversiteleriyle akademik veri kaynağı genişletme programı planlanmıştır.

Multimodal Yetenekler İlk Sürüm

MMMU 0.533, MathVista 0.341, ChartQA 0.677 — frontier vision modellerinden 20-40pp altta. V4.1 hedefi: vision encoder 8B → 16B, Türkçe-spesifik vision-text derlem 240GB → 600GB.

Latency Frontier'in 2-3 Katı

V4 ortalama 9.55s, p95 32.77s. Frontier modelleri 3-5s ortalama, p95 8-12s. Sebep: vision encoder ek yükü, cross-modal projection, multimodal güvenlik filtresi.

Multimodal Güvenlik Filtresi False-Positive

V4.0.0'da %10-15; aktif kalibrasyonla V4.0.1'de %2'ye indirildi.

12Yol Haritası

V4.1 → V4.2 → V5: somut iyileştirme hedefleri

V4.1

2026/Q4

Vision encoder 8B → 16B parametre, 24 → 32 katman
Türkçe-spesifik vision-text derlem 240 GB → 600 GB
MMLU-Pro hedefi: 0.50 → 0.65
GPQA Diamond hedefi: 0.38 → 0.55
Latency: avg 9.55s → 4s, p95 32.77s → 15s

V4.2

2027/Q1

Çoklu görsel modu (tek istekte 8 görsele kadar)
Video kabul (60s klipler için 2 FPS frame-sampling)
Speech-to-text entegrasyonu (yerli ASR)

V5

2027/Q3

Heterojen yapay zekâ hızlandırıcıları (GPU + ASIC + FPGA)
Hiyerarşik MoE (H-MoE)
Continual learning (Elastic Replay Buffer)
Post-quantum tam uyum

13Açık Kaynaklaştırma Stratejisi

Akademik denetime açık, modüler yayınlama

Eğitim hattı, HBM/CCW referansları, vision encoder ve cross-modal projection — adım adım açık kaynak yayınlanacak. PII redaksiyonu hariç tüm boru hattı 2026/Q3'ten itibaren akademik denetime açıktır.

Bileşen	Lisans	Yayın
Eğitim boru hattı	Apache-2.0	2026/Q3
HBM/CCW referans	AGPL-3.0	2026/Q4
Vision encoder referans	AGPL-3.0	2027/Q1
Cross-modal projection	AGPL-3.0	2027/Q1
Router-Bus & Adapter API	MPL-2.0	2026/Q4
Benchmark altyapısı	MIT	2026/Q3

14Sonuç

Bağımsız bilimin kanıtı

AIGENCY V4 — eCloud Yazılım Teknolojileri'nin V3 ile başlattığı tam-bağımsız yerli yapay zekâ ailesinin multimodal yetenek kazandırılmış doğrudan ardılıdır. 27 Nisan 2026 tarihinde 13.344 gerçek API çağrısı ve Wilson 95% güven aralığıyla raporlanan değerlendirme, V4'ün küresel manzaradaki konumunu net biçimde ortaya koymuştur.

Türkçe için tasarlanmış, küresel olarak rekabetçi, tam-bağımsız bir yapay zekâ modelinin teknik olarak mümkün olduğunu, üretim ortamında istikrarlı çalıştığını ve şeffaf değerlendirmeyle doğrulanabildiğini gösterir.

Whitepaper TR (PDF)Whitepaper EN (PDF)Asistanı Dene

Egemen.Multimodal.128B parametre.

AIGENCY V4 — bir bakışta

Üç bileşenli modüler tasarım

Metin Çekirdeği — 120B

Vision Encoder — 8B (V4 Yeni)

Cross-Modal Projection

Hiyerarşik Bellek (HBM)

V3'ten Devralan Optimizasyon Yığını

Adaptif LoRA+

Selective Layer Collapse

Yerelleştirilmiş MoE (L-MoE)

4-bit Blok Kuantizasyon

Öbekli Dikkat (Chunked Attention)

278K token, 3 katmanlı bellek, denetlenebilir silme

Görsel akışı opsiyonel, iki adımlı API protokolü

Multimodal Benchmark Sonuçları

1.826 GB Türkçe-öncelikli derlem, GPG-imzalı boru hattı

Veri Kaynakları (Metin)

13.344 gerçek API çağrısı, deterministik koşullar

22 Benchmark — 4 Kategori

Frontier modellerle yan yana, 22 benchmark

Tier 1 — Kritik Karşılaştırma

Frontier yayınlanmadığından — fiili küresel referans

Stratified subsample (n=1000)

Operasyonel Performans

Çekirdek aynı, multimodal eklendi

Çok katmanlı şifreleme, post-quantum hazırlık

Skor profili → 8 sektörde uygulama

Kamu & Devlet

Hukuk & LegalTech

Bankacılık & Finans

Eğitim & Yükseköğretim

Sağlık & Hastane Sistemleri

Savunma & Kritik Altyapı

Medya & Yayıncılık

Yazılım & AR-GE

Bilimsel itibarın temeli: eksiklerin gizlenmemesi

GPQA Diamond ve MMLU-Pro

Multimodal Yetenekler İlk Sürüm

Latency Frontier'in 2-3 Katı

Multimodal Güvenlik Filtresi False-Positive

V4.1 → V4.2 → V5: somut iyileştirme hedefleri

V4.1

V4.2

V5

Akademik denetime açık, modüler yayınlama

Bağımsız bilimin kanıtı

Egemen.
Multimodal.
128B parametre.