Legacy botdetectie scoort drie dingen goed: waar een request vandaan komt (IP-reputatie), wat het claimt te zijn (user agent en headers), en hoe snel het aankomt (rate). Moderne AI-agenten verslaan alle drie met opzet. Ze routeren via residentiële proxypools, sturen echte headful browsers, en doseren hun acties als een afgeleide mens. Het resultaat is een zelfverzekerd "human"-verdict op verkeer dat volledig geautomatiseerd is.
Dit is een gatenanalyse in plaats van een toolrondje. Het brengt exact in kaart welk legacy-signaal elke agentcapaciteit neutraliseert, en wat detectie op browserlaag ziet dat de edge niet kan zien. cside draait in de pagina, dus het legt apparaat, echte IP achter een proxy, runtime-browserstatus en interactietiming vast, signalen die edge-only controls nooit observeren.
Waar elk legacy signaal breekt
Edge-botdetectie was afgestemd op mechanische scripts: datacenter-IP's, valse user agents, perfecte timing en requestfloods. AI-agenten zijn gebouwd om op geen daarvan te lijken. Hier is de falenkaart signaal voor signaal.
| Legacy signaal | Agentcapaciteit die het verslaat | Wat de edge ziet | Wat de browserlaag ziet |
|---|---|---|---|
| IP-reputatie | Residentiële proxypools (één schoon ISP-IP per sessie) | Een plausibel thuis-ISP-adres | VPN/proxy-gedragsmismatch achter de IP |
| User-agent + headers | Echte headful Chrome, geen vervalste UA-string | Een matchende, legitiem ogende browser | CDP-runtime-artefacten, automation-hooks |
| Rate limiting | Menselijk tempo, jitter, spreiding buiten piekuren | Normaal requestvolume | Interactietiming te uniform om menselijk te zijn |
| JS-challenge / CAPTCHA | Solverdiensten en challenge-passing tooling | Een opgeloste, gepasseerde challenge | Fingerprintdrift tussen loads in één sessie |
| Device fingerprint (enkele waarde) | Per-sessie randomisatie (canvas-ruis, UA-rotatie) | Een "nieuw apparaat" elke keer | GPU/font/scherm-sets inconsistent met claim |
Lees de tabel als een keten: versla reputatie met een residentiële exit, versla de UA-check met een echte browser, versla rate limits met geduld, versla de challenge met een solver, en versla single-point fingerprints met ruis. Geen enkel legacy-control overleeft die keten, daarom sluit het stapelen van meer ervan op de edge het gat niet.
Residentiële proxies maken IP-reputatie tot ruis
IP-reputatie gaat ervan uit dat slecht verkeer clustered op bekende-slechte reeksen. Residentiële proxynetwerken breken die aanname door echte consumenten-IP's te huren, dus elke agentsessie verlaat het netwerk via een adres dat bij een thuisrouter of telefoon hoort. De reputatiequery retourneert schoon. Een datacenter-reeksblokkade doet niets.
Wat nog lekt is gedrag, niet het adres. Een residentieel IP dat plotseling een server-grade TLS-stack draagt, een tijdzone presenteert die zijn geolocatie tegenspreekt, of verbindingskarakteristieken toont die inconsistent zijn met een consumentenlijn, is een gedragsmismatch die de edge meestal niet kan oplossen. cside leest VPN- en proxygedrag vanuit de sessie, dus een "schoon" IP dat zich als anonimisator gedraagt wordt op gedrag gemarkeerd in plaats van op een statische blocklist.
Echte headful browsers passeren de user-agent-test door echt te zijn
Het oude signaal was een afwezige of valse browseromgeving: een navigator.webdriver-flag op true, een headless-Chrome-banner, een user-agent-string die niet overeenkwam met de render-engine. Serieuze automatisering is daar allemaal voorbijgegaan. Agenten sturen nu echte headful Chrome, dus de user agent matcht omdat de browser daadwerkelijk Chrome is.
De duurzame signalen leven één laag dieper, in runtime-state die de operator niet volledig kan saniteren:
- CDP Runtime-lekken: het Chrome DevTools Protocol dat automation-frameworks koppelen laat observeerbare artefacten achter in de live pagina.
- Fingerprintdrift: waarden die stabiel zouden moeten blijven voor een echt apparaat (canvas, audio, GPU-strings) verschuiven tussen loads wanneer de sessie ze randomiseert.
- Omgevingscontradicties: een geclaimd apparaat wiens fontset, schermmetriek of GPU-vendor niet matcht met wat die hardware zou produceren.
- Automation-hooks: instrumentatie die een agent injecteert om de pagina te lezen en erop te reageren, die een handgestuurde browser niet zou dragen.
Elke hiervan afzonderlijk kan gepatcht worden. Ze allemaal consistent vervalsen, over elke paginalaad in een sessie, zonder tegenspraak, is het moeilijke deel. Detectie op browserlaag wint door correlatie, niet door één boolean.
Menselijk tempo verslaat rate limits, en CAPTCHA-solving verslaat challenges
Rate limiting vangt de requestflood. AI-agenten flooden niet. Een reasoning-agent voltooit een meerstapse-taak op menselijk tempo, voegt jitter tussen acties toe, spreidt werk over uren buiten de piek, en blijft onder elke per-IP-drempel. Dezelfde geduldigheid is wat agenten in staat stelt om accountbeveiliging te breken en bot-gedreven account takeover aan te jagen zonder een volumealarm af te laten gaan. Het volumesignaal blijft plat, dus de rate limiter vuurt nooit.
CAPTCHA en achtergrond-JS-challenges hebben hetzelfde probleem vanaf de andere kant. Solverdiensten en challenge-passing tooling halen de poort, waarna de sessie volledig geverifieerd lijkt voor alles stroomafwaarts. Het signaal dat overleeft is niet of de challenge gepasseerd is, maar hoe de sessie eromheen gedraagt: timing die te regelmatig is, interactiepatronen zonder menselijke aarzeling, en fingerprintwaarden die verschuiven terwijl de "geverifieerde mens" browsert. Dat zijn interior signalen, vastgelegd in de pagina, niet op de edge.
Het tempo van stealth-automatisering
De reden dat dit gat snel groeide is tooling. cside's 2026 web security research rapporteert dat playwright-stealth-installaties ongeveer tienvoudig groeiden tijdens 2025, een bruikbare proxy voor hoe snel stealth-browser-automatisering van niche naar mainstream aanvalsinfrastructuur ging. cside 2026 research report
Wanneer de evasion-stack een one-line install is, houdt de aanname dat automatisering op automatisering lijkt geen stand. Detectie moet verhuizen naar waar de agent daadwerkelijk draait.
Wat eraan te doen
Ruim de edge niet uit. Houd legacy-controls voor volume en bekend-slecht verkeer, en voeg dan detectie op browserlaag toe voor alles wat er schoon doorheen glipt.
- Houd IP-reputatie en rate limits als een grof eerste filter voor evident misbruik.
- Voeg in-page detectie op browserlaag toe om headful, proxied, menselijk getimede sessies te vangen.
- Correleer signalen (proxygedrag, CDP-artefacten, fingerprintdrift, timing) in plaats van er één te vertrouwen.
- Classificeer goede automatisering apart zodat monitoringbots en consumenten-agenten niet geblokkeerd worden, de grens die botdetectie van AI-agentdetectie scheidt.
- Pas gradueel beleid toe: allow, monitor, challenge, throttle of block op intentie en schade.
- Bewaar een bewijsspoor (classificatie, signalen, actie en uitkomst) om drempels in de loop der tijd te tunen.
Hoe cside past
cside breidt botdetectie uit van de edge tot in de browser. Het draait in de pagina tijdens normale loads en legt apparaat, real-IP-behind-proxy-gedrag, runtime-browserstatus en interactietiming vast, de signalen die een residentiële-geproxiede, headful, menselijk getimede agent blootleggen die IP-reputatie en user-agent-checks doorlaten. Van daaruit passen teams beleid toe per agenttype en risico in plaats van elke geautomatiseerde bezoeker gelijk te behandelen.







