Nvidia BlueField-4 STX, Depolamaya Bağlam Bellek Katmanı Ekleyerek Agentik Yapay Zeka Verimlilik Açığını Kapatıyor

18.03.2026 01:13
Geleneksel depolamanın çıkarım hızına yetişememesi nedeniyle bir yapay zeka ajanı görev ortasında bağlamını kaybediyorsa, bu model değil depolama sorunudur. GTC 2026'da Nvidia, GPU'lar ile geleneksel depolama arasında özel bir bağlam bellek katmanı ekleyen modüler BlueField-4 STX mimarisini duyurdu ve 5 kat token verimi, 4 kat enerji verimliliği ve 2 kat veri alma hızı vaat ediyor.
Nvidia BlueField-4 STX, Depolamaya Bağlam Bellek Katmanı Ekleyerek Agentik Yapay Zeka Verimlilik Açığını Kapatıyor
Gorsel kaynagi: VentureBeat ·

Geleneksel depolamanın çıkarım hızına yetişememesi nedeniyle bir yapay zeka ajanı görev ortasında bağlamını kaybediyorsa, bu model değil depolama sorunudur. GTC 2026'da Nvidia, GPU'lar ile geleneksel depolama arasında özel bir bağlam bellek katmanı ekleyen modüler BlueField-4 STX mimarisini duyurdu. Nvidia, bu mimarinin geleneksel CPU tabanlı depolamaya kıyasla 5 kat token verimi, 4 kat enerji verimliliği ve 2 kat veri alma hızı sağladığını iddia ediyor.

STX'nin hedeflediği darboğaz, anahtar-değer (KV) önbellek verisidir. KV önbellek, modelin daha önce işlediği verilerin kayıtlarını tutar ve büyük dil modellerinin her çıkarım adımında tüm bağlam üzerinde yeniden hesaplama yapmasını önler. Bu önbellek, bir ajanın oturumlar, araç çağrıları ve mantıksal adımlar arasında tutarlı bir çalışma belleği sürdürmesini sağlar. Bağlam pencereleri büyüdükçe ve ajanlar daha fazla adım attıkça, önbellek de büyür. Geleneksel depolama yolunu kullanarak GPU'ya erişmeye çalıştığında çıkarım yavaşlar ve GPU kullanımı düşer.

STX, Nvidia tarafından doğrudan satılan bir ürün değil; şirketin depolama iş ortakları ekosistemine dağıttığı bir referans mimaridir. Bu sayede satıcılar, etrafında AI-yerel altyapı inşa edebilirler. Mimarinin merkezinde, Nvidia'nın Vera CPU'su ile ConnectX-9 SuperNIC'i birleştiren yeni depolama-odaklı BlueField-4 işlemcisi yer alıyor. Spectrum-X Ethernet ağı üzerinde çalışıyor ve Nvidia'nın DOCA yazılım platformu aracılığıyla programlanabiliyor.

İlk raf ölçekli uygulama olan Nvidia CMX bağlam bellek depolama platformu, GPU belleğini yüksek performanslı bir bağlam katmanıyla genişletiyor. Bu katman, çıkarım sırasında büyük dil modelleri tarafından oluşturulan KV önbellek verilerini depolamak ve erişmek için özel olarak tasarlandı. CMX, bu önbelleğe genel amaçlı depolama üzerinden gidip gelmeye gerek kalmadan erişim sağlıyor. Nvidia'nın hiperscale ve yüksek performanslı hesaplama başkan yardımcısı Ian Buck, "Geleneksel veri merkezleri yüksek kapasiteli genel amaçlı depolama sunar ancak çok adımlı, araç kullanan ve farklı oturumlar arasında çalışan AI ajanları için gereken yanıt hızına genellikle sahip değildir" dedi.

STX mimarisi, donanım referans tasarımının yanı sıra yazılım referans platformu da sunuyor. Nvidia, DOCA platformunu genişleterek "DOCA Memo" adlı yeni bir bileşen ekledi. Buck, "Depolama sağlayıcılarımız, BlueField-4 işlemcisinin programlanabilirliğini kullanarak agentik AI fabrikası için depolamayı optimize edebilirler. Referans raf mimarisine ek olarak, müşterilerine yenilik ve optimizasyon sunmaları için bir yazılım platformu da sağlıyoruz" diye belirtti. STX tabanlı sistemler, 2026'nın ikinci yarısında iş ortakları tarafından sunulmaya başlanacak.

IBM, STX duyurusunun her iki tarafında yer alıyor. Hem STX tabanlı altyapıyı birlikte tasarlayan depolama sağlayıcılarından biri olarak listeleniyor hem de Nvidia, DGX platformlarında sertifikalı ve doğrulanmış IBM Storage Scale System 6000'i kendi GPU-yerel analiz altyapısının yüksek performanslı depolama temeli olarak seçtiğini doğruladı. Ayrıca GTC'de IBM, Nvidia ile watsonx.data Presto SQL motoru ile Nvidia'nın cuDF kütüphanesi arasında GPU hızlandırmalı entegrasyon duyurdu. Nestlé ile yapılan üretim kanıtı konseptinde, 186 ülkeyi ve 44 tabloyu kapsayan Order-to-Cash veri ambarının veri yenileme süresi 15 dakikadan 3 dakikaya düştü. IBM, %83 maliyet tasarrufu ve 30 kat fiyat-performans iyileştirmesi bildirdi.

STX, depolama katmanının kurumsal yapay zeka altyapısı planlamasında öncelikli bir konu haline geldiğinin işaretidir. Genel amaçlı NAS ve nesne depolama, çıkarım gecikmesi gereksinimlerini karşılamak üzere tasarlanmamıştır. Dell, HPE, NetApp ve VAST Data gibi iş ortaklarının STX tabanlı sistemleri, Nvidia'nın önerdiği pratik alternatiflerdir. DOCA yazılım platformu ise depolama davranışını agentik iş yüklerine göre optimize etmek için programlanabilirlik katmanı sağlar.

İlgili Haberler