Het aantal verwerkte tokens en agents in productie neemt wereldwijd exponentieel toe. Daar moet ook de infrastructuur van bedrijven op gebouwd zijn, want anders worden de kansen van data en AI onvoldoende benut. Volgens Huawei is een vijflaagse AI-stack benodigd om veilig en snel artificial intelligence in te zetten voor zware workloads. We bezochten het bedrijf tijdens het Innovative Data Infrastructure Forum 2026 in Parijs.
Met als eventthema ‘Data Awakening, Infra Evolving’ is het duidelijk dat de focus bij Huawei verschuift naar het bouwen van infrastructuuroplossingen rondom data. Op die manier is het mogelijk meer intelligentie in te bouwen in de bedrijfsomgeving. Yuan Yuan, President of Huawei Data Storage Product Line, ziet dat dit zeker nodig is vanwege de tokenexplosie. Zo wijst hij tijdens een presentatie en in gesprek met de pers op de geprojecteerde cijfers rond tokens en agents. Vorig jaar werden wereldwijd circa 6 miljard tokens per minuut verwerkt. Dit jaar groeit dat getal naar verwachting naar 15 miljard. Ondertussen gaan IDC-cijfers uit van bijna 30 miljoen actieve AI-agents eind vorig jaar, tegenover een geschatte 2,2 miljard agents over vier jaar.
Tokens worden, in zijn woorden, net zo onmisbaar als lucht en water. Maar tokens alleen vertellen niet het hele verhaal. De vraag is welke infrastructuur nodig is om die tokens ook betekenisvol te laten zijn voor bedrijfsprocessen, zodat AI echt waardevol wordt. Yuan deelt daarover een voorbeeld uit de Chinese zorg. Een van de grootste ziekenhuizen in China zette drie AI-modellen in voor digitale pathologie. Eén werd gebruikt voor het detecteren van kankercellen, een ander voor het emuleren van microscooponderzoek en de laatste voor het verzorgen van patiëntcommunicatie. De modellen werden getraind op een miljoen digitale pancreasbeelden en namen kennis op uit 300 medische handboeken, verwerkt via 16 GPU-kaarten. Door hier AI in te zetten daalde de tijd om een pathologierapport te genereren van 40 minuten naar 15 seconden.
Tip: Huawei toont full-stack AI-datacenterstrategie
Vijf lagen voor een AI-stack
Yuan verdeelt de vereiste infrastructuur om gewenste resultaten te halen in vijf lagen. Bovenaan staat het Agent Framework, een omgeving voor het zelfstandig ontwikkelen en uitrollen van agents, inclusief beveiligde sandboxes. Daaronder komen de modellen zelf, waarbij het gaat om het verfijnen, afstemmen op lokale regelgeving en het aanpassen van de parameters van modellen.
De derde laag is de compute, het infrastructuurstuk waar Huawei door de jaren heen een sterke naam in opbouwde. Deze laag verdient wat extra aandacht. Het gaat hier vooral om GPU-kaarten en processors voor inferencing. Dat zijn de componenten waar Huawei eigen technologie voor heeft ontwikkeld, doordat het vanwege de geopolitieke ontwikkelingen niet op de industriestandaarden Intel/AMD en Nvidia kan bouwen. Dit is enerzijds opgelost met Arm-gebaseerde Kunpeng-processors die storage controllers en servertaken uitvoeren. Anderzijds zijn er Ascend-NPU’s voor het laden van datasets en het uitvoeren van AI-workloads.
Terug naar de volgende lagen. De laag onder de compute is namelijk het AI Data Platform, met daarin een knowledge base, een KV-cache voor memory-optimalisatie en een geheugensysteem. De vijfde en onderste laag is het data lake, bedoeld om data vanuit verschillende organisatieonderdelen te consolideren.
Die vijflaagse aanpak klinkt vrij compleet en is in productieomgevingen ook al zeer toepasbaar. Denk aan een autofabrikant die mikt op volledig zelfrijdende voertuigen. Voor het trainen van level-5-autonomie heeft die meer dan 100 terabyte aan sensordata per voertuig nodig, verspreid over meerdere datacenters, met mondiale databeschikbaarheid. Het vinden van zeldzame scenario’s, zoals een hond die bij rood licht over straat rent in de regen, vereist ultrasnelle semantische zoekopdrachten over honderden terabytes aan beeldmateriaal per seconde. Dat kan eigenlijk alleen met een gelaagde aanpak.
Weer een andere toepassing betreft AI-gestuurde softwareontwikkeling. Grote codeertrajecten vragen tientallen of zelfs honderden iteratierondes. Het steeds opnieuw laden van alle context naar de GPU is inefficiënt. Een KV-cache op storage-niveau geeft elke gebruiker snelle, dedicated toegang. Daarboven komt een geheugensysteem dat voortgang, debugresultaten en ervaringen opslaat zodat de AI-agent met elke ronde beter wordt.
Concrete producten per laag
Huawei vertaalt de vijf lagen naar een reeks producten. Voor het data lake is er het storagesysteem OceanStor Pacific, dat schaalt van enkele terabytes tot 900.000 petabytes. 100 petabyte past hierbij in een 2U-chassis, met een energieverbruik van 25 watt per terabyte. Het platform ondersteunt semantisch zoeken op beeld, video en tekst, inclusief cross-modale zoekopdrachten zoals image-to-text.
Voor het AI-dataplatform biedt Huawei een 3+1-oplossing. Deze combineert een knowledge base met meer dan 95 procent retrieval-nauwkeurigheid, een KV-cache op petabyte-niveau die de time-to-first-token met 45 tot 90 procent kan verkorten en een ingebouwd geheugensysteem. Context Memory Storage (CMS) richt zich op hyperscalers en supercomputers en biedt een gedeelde key-value-cachepool. Yuan stelt dat de CMS-architectuur heterogene rekensystemen verbindt.
Voor modelengineering is er een one-stop-tool voor het verfijnen en wisselen van modellen, met ondersteuning voor meer dan 30 populaire modellen. Het agentplatform, Nexus genaamd, werkt zonder dat de gebruiker programmeervaardigheden hoeft te bezitten. In theorie zouden artsen, financiële medewerkers en docenten met een grafische tool agents kunnen bouwen zonder Python te kennen. Prompts en vaardigheden worden continu geoptimaliseerd via een zelfevoluerende structuur.
Security verweven door de stack
Huawei krijgt door de geopolitieke situatie geregeld vragen over security. Op dit vlak zet het bedrijf dan ook behoorlijk in door de hoogste securitycertificeringen en -standaarden te halen. Zo wil Huawei Europese organisaties verzekeren dat ze met een gerust hart de kritieke infrastructuurproducten kunnen gebruiken. Security is hiervoor verweven door de hele infrastructuur. Yuan noemt vier typen dreigingen. Op agentniveau bestaat het risico dat agents ongewenste acties uitvoeren, zoals het aanpassen van bestanden of systeeminstellingen. Op modelniveau is er het gevaar van model poisoning: het injecteren van kwaadaardige code om uitkomsten te manipuleren. Op platformniveau gaat het om data tampering, oftewel het aanpassen van missiekritische gegevens. En op het niveau van het data lake speelt ransomware.
Hier kan een private AI-stack boven uitsluitend public clouddiensten een goede keuze in zijn. Privacybescherming, compliance met lokale regelgeving en het zelf genereren van waarde zijn daarvoor de voornaamste redenen. Die factoren kunnen de doorslag geven bij het bouwen van een nieuwe infrastructuur. Een infrastructuur die zorgt voor data awakening en de belofte van AI in de praktijk inlost.








/s3/static.nrc.nl/wp-content/uploads/2026/05/27191233/270526BUI_2034038419_klette.jpg)


English (US) ·