Blog News

Wanneer een AI-API het antwoord van een andere gebruiker teruggeeft: gedeelde caches en cross-tenant lekken

Een incident met de Claude-API lijkt antwoorden van andere gebruikers te hebben teruggegeven. Waarom gedeelde caches cross-tenant lekken veroorzaken.

Jun 05, 2026 • 10 min read

Simon Wijckmans Founder & CEO

Kort samengevat: cross-tenant lekkage van AI-API-responses

Een LLM-API-response behandelen als een privékanaal tussen jou en het model is de fout. Het is data die terugkomt uit een enorme gedeelde stack van caches, routers en pools, en op een slechte dag belandt de output van de ene tenant in de sessie van een andere.
Het Claude API-incident van 2026-06-05 raakte Opus 4.5 tot 4.8 en Sonnet 4.6 uren lang. Het lijkt op de redis-py-fout van 2023 bij OpenAI die beperkte factureringsgegevens van 1,2% van ChatGPT Plus-abonnees blootlegde, en cside bewaakt de browserlaag waar AI-output, third-party scripts en geauthenticeerde sessies elkaar treffen.
Render je modeloutput in de browser, saneer voordat het de DOM raakt en valideer de vorm op elke response. Werk je met gereguleerde data, kies zero-retention-voorwaarden en log request- en response-metadata om een modelfout van een tenantlek te onderscheiden.

Een paar uur lang in de middag van 2026-06-05 lijkt de Claude-API antwoorden te hebben teruggegeven die niet toebehoorden aan de gebruiker die ze had opgevraagd. Je stuurt een verzoek en je krijgt uitvoer terug die leest als een antwoord op de prompt van iemand anders.

De statuspagina van Anthropic registreerde het voorval als "verhoogde fouten op veel Claude-modellen", met gevolgen voor Opus 4.5 tot en met 4.8 en Sonnet 4.6. Het beschrijft, op het moment van schrijven, geen datalek. De lezing dat het om gegevens tussen gebruikers ging, komt uit rondgaande screenshots en eerstehands meldingen, dus behandel het als een vroege interpretatie, niet als een bevestigde inbreuk.

Het interessante is niet of één aanbieder een slechte middag had. Het is de foutklasse. Wanneer zoiets gebeurt, is het bijna altijd terug te voeren op gedeelde, muteerbare state onder belasting, en dat is een risico dat elke snel opschalende AI-aanbieder op dit moment met zich meedraagt.

Wat er lijkt te zijn gebeurd

Volgens de statuspagina van Anthropic liep het incident door de middag van 2026-06-05: het onderzoek werd geopend rond 15:19 UTC, het probleem werd geïdentificeerd rond 15:43 UTC en als opgelost gemarkeerd rond 18:28 UTC. De getroffen modellen waren Claude Opus 4.5, 4.6, 4.7 en 4.8, samen met Sonnet 4.6. Het officiële label was "verhoogde fouten", de generieke bak die aanbieders gebruiken voor alles van time-outs tot misvormde antwoorden.

De meldingen die de aandacht trokken, beschrijven iets specifiekers. Gebruikers zeiden dat sommige API-aanroepen inhoud teruggaven die niets met hun eigen prompt te maken had en, in minstens één veelgedeeld geval, verscheen de taak van de ene persoon binnen het antwoord van een volkomen onbekende gebruiker. Meerdere mensen zeiden dat ze ontvingen wat leek op de inferentie-uitvoer van een andere klant, en dat ze het zorgvuldig hadden gecontroleerd voordat ze concludeerden dat het een fout aan de serverkant was en geen bug aan hun kant.

Twee dingen zijn tegelijk waar. Anthropic heeft geen blootstelling van gegevens tussen gebruikers bevestigd, en het publieke bewijs is daarmee consistent. Een verantwoorde lezing houdt beide vast: dit lijkt op cross-tenant lekken van antwoorden, en het is nog niet officieel als zodanig bevestigd. Ik geef de gelekte screenshots hier niet weer, omdat ze de prompt en uitvoer van een andere klant bevatten, precies de gegevens die niet verder zouden mogen circuleren.

De foutklasse: gedeelde, muteerbare state onder belasting

Cross-tenant lekken is wanneer de gegevens van de ene klant opduiken in de sessie van een andere. Het is een van de oudste en gevaarlijkste bugs in multi-tenant systemen, en het komt zelden van een spectaculaire inbreuk. Het komt meestal van een stuk gedeelde, muteerbare state dat per verzoek geïsoleerd had moeten zijn en dat, onder de verkeerde omstandigheden, dat niet was.

Een moderne AI-API is geen enkel programma dat één verzoek tegelijk beantwoordt. Het is een stapel gedeelde lagen: load balancers, request routers, gateways, queues, in-memory caches en connectiepools, die allemaal tegelijk elke klant bedienen om latentie en kosten laag te houden. Elk van die lagen houdt state vast. Elke laag is een plek waar een verzoek het verkeerde antwoord kan oppikken als een cachesleutel botst, een connectie wordt hergebruikt nadat ze had moeten worden weggegooid, of een geannuleerd verzoek een verouderd object achterlaat.

Het symptoom is bijna altijd hetzelfde: je vraagt je eigen gegevens op en je krijgt die van iemand anders. De oorzaak is bijna altijd saai: een kleine fout in hoe een gedeeld object wordt hergebruikt, getriggerd door belasting of door een randgeval zoals een geannuleerd of verlopen verzoek.

We hebben dit patroon eerder gezien

Het duidelijkste precedent is OpenAI, in maart 2023. Op 2023-03-20 veroorzaakte een wijziging aan hun servers een piek in geannuleerde Redis-verzoeken, die een bug in de clientbibliotheek redis-py activeerde. Gedurende een venster die dag konden sommige ChatGPT-gebruikers de gesprekstitels van andere actieve gebruikers zien en, in sommige gevallen, het eerste bericht van een nieuw aangemaakt gesprek.

Hetzelfde incident stelde beperkte factureringsgegevens bloot. OpenAI stelde ongeveer 1,2% van de ChatGPT Plus-abonnees op de hoogte dat een andere gebruiker hun voor- en achternaam, factuuradres, kaarttype, vervaldatum en de laatste vier cijfers van hun kaart had kunnen zien. Volledige kaartnummers werden nooit blootgesteld. Zoals Help Net Security destijds berichtte, en zoals OpenAI in zijn eigen post-mortem bevestigde, was de hoofdoorzaak een gedeelde cache- en connectielaag die na geannuleerde verzoeken gegevens aan de verkeerde client teruggaf.

Dat is dezelfde foutklasse als het symptoom dat in de meldingen over Claude wordt beschreven: een gedeelde, muteerbare laag die de gegevens van de ene klant onder belasting aan een andere overhandigt. Ander bedrijf, andere bibliotheek, dezelfde vorm.

Waarom opschalen dit waarschijnlijker maakt, niet minder

Hier is het ongemakkelijke structurele deel. AI-aanbieders voegen capaciteit sneller toe dan vrijwel elke infrastructuur in de geschiedenis van de informatica. De vraag overtreft de hardware, dus teams blijven lagen toevoegen om het bij te benen: meer caching om tokenkosten te drukken, meer routing om de belasting over regio's en modelversies te spreiden, meer proxy's en gateways om quota's en failover te beheren.

Elk van die lagen is een prestatiewinst en een nieuwe plek waar state kan lekken. Een cache die de verkeerde sleutel serveert, een router die een connectie hergebruikt, een proxy die het ene antwoord in een andere stroom vouwt: elk is één bug verwijderd van cross-tenant lekken. Hoe agressiever een aanbieder opschaalt, hoe meer van deze lagen hij draait en hoe meer belasting hij erdoorheen duwt.

Dit is dus minder een verhaal over Anthropic dan een verhaal over iedereen. De aanbieders die het hardst rennen om capaciteit toe te voegen, zijn precies degenen die het meest blootgesteld zijn aan deze klasse bugs, omdat snelheid en gedeelde infrastructuur de manier zijn om miljoenen verzoeken goedkoop te bedienen. Het is geen teken dat één bedrijf nalatig is. Het is een eigenschap van de architectuur waarop de hele sector bouwt.

Wat dit betekent als je op LLM-API's bouwt

De praktische conclusie is een mentaliteitsverandering. Een antwoord van een LLM-API is geen vertrouwd, privékanaal tussen jou en het model. Het zijn gegevens die terugkomen van een enorm gedeeld, snel veranderend systeem en die, op een slechte dag, fout, verouderd of gekruist met een andere klant kunnen zijn.

Behandel ze zo:

Ga ervan uit dat een antwoord af en toe bij het verkeerde verzoek kan horen. Ontwerp geen flows waarin één gekruist antwoord stilletjes het record van een gebruiker beschadigt of het aan iemand anders blootstelt.
Stuur geen gegevens naar een LLM-API die je niet zou tolereren als ze ergens anders opduiken, tenzij je contract en de controles van de aanbieder ze echt dekken. Voorwaarden voor zero-retentie en enterprise-isolatie zijn hier belangrijk.
Valideer en beperk antwoorden voordat je ernaar handelt. Controleer vorm, type en plausibiliteit, zoals je elke niet-vertrouwde invoer zou valideren.
Log genoeg om lekken te detecteren. Als je nooit verzoek- en antwoordmetadata opslaat, kun je het verschil niet zien tussen een modelfout en een antwoord dat nooit van jou was.

Er is een versie hiervan op de browserlaag die gemakkelijk te missen is. Een groeiend aantal apps sluist modeluitvoer rechtstreeks de pagina in: gestreamde antwoorden, door AI gegenereerde HTML, inline weergegeven toolresultaten. Als die uitvoer gekruist of geïnjecteerd kan zijn, verandert het blindelings weergeven ervan een backendprobleem in een probleem aan de clientkant. Je kunt eindigen met het tonen van de inhoud van een andere gebruiker aan jouw gebruiker, of met het uitvoeren van mark-up die je niet hebt geschreven, binnen een sessie waarin je gebruiker al is geauthenticeerd.

Wat je deze week kunt doen

Breng elke plek in kaart waar een LLM-API-antwoord je systeem binnenkomt en markeer welke rechtstreeks in de browser worden weergegeven.
Behandel die antwoorden als niet-vertrouwde invoer: valideer de structuur, escape alles wat in de pagina wordt weergegeven en injecteer nooit ruwe model-HTML zonder die te ontsmetten.
Beslis expliciet welke gegevens je bereid bent naar elke aanbieder te sturen en bevestig de retentie- en isolatievoorwaarden die van toepassing zijn.
Voeg logging en alerts toe die een misvormd antwoord kunnen onderscheiden van een antwoord dat niet bij het verzonden verzoek past.
Houd de browserlaag in de gaten, waar AI-uitvoer, scripts van derden en gebruikersgegevens nu in dezelfde sessie samenkomen.

Hoe cside past

cside draait niet binnen de backend van Anthropic of van welke aanbieder dan ook, en kan een cache die de gegevens van de verkeerde klant teruggeeft niet repareren. Wat het wel aanpakt, is dezelfde klasse problemen een stap dichter bij je gebruiker: de browser, waar AI-antwoorden, scripts van derden en geauthenticeerde sessies nu dezelfde pagina delen.

cside biedt runtime-zichtbaarheid op wat er werkelijk in die browsersessie wordt uitgevoerd: welke scripts laden, hoe ze na deployment veranderen, welke gegevens ze lezen en waar ze die naartoe sturen. Naarmate meer applicaties modeluitvoer rechtstreeks in de pagina weergeven, is die zichtbaarheid de manier om de gevolgen aan de clientkant van een fout of gekruist antwoord te betrappen, zoals inhoud die in de verkeerde sessie wordt weergegeven of een script dat reikt naar gegevens die het nooit zou mogen aanraken.

Het bredere punt is hetzelfde dat cside altijd over scripts van derden heeft gemaakt, nu veralgemeend naar AI-infrastructuur. Elke laag die je toevoegt om sneller te gaan, is een laag waar gegevens op de verkeerde plek kunnen opduiken. Je kunt die lagen niet verwijderen, maar je kunt de laag instrumenteren die het dichtst bij je gebruiker staat.

Begin met client-side security voor runtime-scriptmonitoring, of met Privacy Watch om precies te zien wat de code op je pagina's verzamelt en verstuurt.

Verder lezen op cside

Per 2026-06-05. De details van het Claude-API-incident weerspiegelen de statuspagina van Anthropic en de openbare gebruikersmeldingen die op die datum beschikbaar waren. Anthropic heeft het voorval gekarakteriseerd als verhoogde fouten en heeft, op het moment van schrijven, geen blootstelling van gegevens tussen gebruikers bevestigd.

Boek een cside-demo

Founder & CEO Simon Wijckmans

Founder and CEO of cside. Previously a product manager on Cloudflare Page Shield (now Cloudflare Client-Side Security). Co-chair of the W3C Anti-Fraud Community Group and a Forbes 30 Under 30 honoree. Building accessible security against client-side attacks, web security is not an enterprise-only problem.

Back to top

Don't just take our word for it, ask AI

FAQ

Frequently Asked Questions

Anthropic registreerde het voorval als verhoogde fouten op veel Claude-modellen, waaronder Opus 4.5 tot en met 4.8 en Sonnet 4.6, en heeft geen blootstelling van gegevens tussen gebruikers bevestigd. Rondgaande screenshots en eerstehands meldingen suggereren dat sommige API-aanroepen inhoud teruggaven die van andere gebruikers leek te zijn. Op het moment van schrijven is die lezing van gekruiste gegevens tussen klanten consistent met de meldingen, maar niet officieel bevestigd.

Cross-tenant lekken is wanneer de gegevens van de ene klant opduiken in de sessie van een andere. In een AI-API uit dit zich als een verzoek dat een antwoord teruggeeft op de prompt van iemand anders. Het is meestal terug te voeren op gedeelde, muteerbare infrastructuur, zoals een cache of een connectiepool, die onder belasting het verkeerde object teruggeeft.

Caches en connectiepools worden over alle klanten gedeeld om latentie en kosten laag te houden. Als een cachesleutel botst, een connectie wordt hergebruikt nadat ze had moeten worden weggegooid, of een geannuleerd verzoek een verouderd object achterlaat, kan het opgeslagen antwoord van de ene gebruiker aan een andere worden geserveerd. Het symptoom is dat je gegevens terugkrijgt die je nooit hebt opgevraagd.

Ja. In maart 2023 zorgde een bug in de clientbibliotheek redis-py ervoor dat ChatGPT sommige gebruikers de gesprekstitels van andere gebruikers toonde, en stelde het beperkte factureringsgegevens bloot voor ongeveer 1,2% van de ChatGPT Plus-abonnees. Volledige kaartnummers werden niet blootgesteld. Het was dezelfde foutklasse: gedeelde infrastructuur die na geannuleerde verzoeken gegevens aan de verkeerde client teruggaf.

Behandel ze als niet-vertrouwde invoer. Valideer de vorm en plausibiliteit van elk antwoord, vermijd het versturen van gegevens die je niet zou tolereren als ze ergens anders opduiken, en log genoeg metadata om een modelfout te onderscheiden van een antwoord dat nooit van jou was. Als je modeluitvoer in de browser weergeeft, ontsmet die dan voordat ze de DOM raakt.

Monitor en Beveilig Je Third-Party Scripts

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Boek een demo

Start gratis

Start gratis, of probeer Business met een proefperiode van 14 dagen.

cside dashboard interface met script monitoring en beveiligingsanalytics

Wat is cside? Browser-laag zichtbaarheid voor elke bezoeker, mens of agentisch

cside is een browser-laag-platform dat security-, fraude-, privacy- en compliance-teams zichtbaarheid geeft op wat er in de browser van elke bezoeker draait, mens of agentisch.

Nieuwe Accountfraude: Wat Het Is, de Belangrijkste Typen en Hoe Detectie Werkt

Nieuwe accountfraude (NAF) is fraude gepleegd via een nieuw geopend account. Het kent drie vormen, synthetische identiteitsfraude, manipulatie van echte identiteit en het aanmaken van nepaccounts, elk misbruik makend van een andere zwakke plek in standaard registratiecontroles.

Wat is een laptop farm? Hoe fraudeurs mensachtige aanvallen op schaal uitvoeren

Een laptop farm is een fysieke opstelling waarbij operators meerdere apparaten met afzonderlijke identiteiten gebruiken om unieke gebruikers te simuleren. Leer hoe ze werken en hoe browsersignalen ze blootleggen.

Wat is formjacking? Hoe de aanval werkt en hoe je hem stopt

Formjacking is een client-side aanval die JavaScript injecteert om betaal- en inloggegevens te stelen terwijl de gebruiker typt. Lees hoe de aanval werkt, waarom traditionele tools hem missen en hoe je hem detecteert.

AI-agenten en stealth-browsers detecteren: de signalen die ze verraden

Een signaal-voor-signaalgids voor stealth- en anti-detect-browsers: CDP- en webdriver-tells, headless-quirks, font- en WebGL-drift, en gedrag.

Maakt Shopify je PCI DSS-compliant? Wat vereisten 6.4.3 en 11.6.1 nog steeds eisen

Shopify is een PCI DSS Level 1-dienstverlener, maar dat certificeert Shopify's eigen systemen, niet jouw webshop. Vereisten 6.4.3 en 11.6.1 blijven jouw verantwoordelijkheid.

10 beste ecommerce fraudepreventiesoftware platformen (2026)

Een buyer's framework voor webapp-fraudetools dat browserbewijs afzet tegen false-positive-kosten voor de shortlist.

Botdetectie in het tijdperk van AI-agenten: waarom legacy tools ze missen

Edge-bottools scoren IP's, user agents en rate. AI-agenten verslaan ze allemaal. Een gat-per-gat analyse van waar legacy detectie faalt en wat browsersignalen toevoegen.

AI-agenten detecteren: muis, scroll, typen

Gedragssignalen vangen AI-agenten die CAPTCHA passeren en IP's roteren: muispaden, scrollritme en toetsaanslag-timing die automatisering niet namaakt.

Account takeover detecteren voordat het gebeurt: browser- en apparaatsignalen

Instrumenteer browser- en apparaatsignalen die vóór ATO afgaan: fingerprintdrift, headless- en stealth-browsertells, proxy en velocity.