Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.
SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.
Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.
SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:
KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.
KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.
KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.
„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."
Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab
Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai
Medienanfragen:
Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA
____________________________________
Über Graid Technology
Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.
(U.Kabuchyn--DTZ)