Blog Attacks

Hoe Blokkeer Je ClaudeBot op Je Website

ClaudeBot crawlt je site om Anthropics Claude-modellen te trainen. Zo blokkeer je het met robots.txt en IP-ranges, en wat de blokkering nog steeds mist.

Jun 16, 2026 • 6 min read

Mike Kutlu Client-Side Security Consultant

Kort samengevat: ClaudeBot blokkeren zonder Claude-agents te stoppen die je site bezoeken

Crawler versus agent: Teams blokkeren ClaudeBot in de verwachting dat Claude van hun site verdwijnt, en de volgende dag stapt Claude Computer Use binnen. ClaudeBot is Anthropics trainingcrawler; door Claude aangedreven agents die het web bezoeken gebruiken andere infrastructuur en andere user-agents.
De robots.txt-blokkade: ClaudeBot identificeert zich als Claude-Web/1.0, is gedocumenteerd in Anthropics crawlerpagina's en respecteert robots.txt betrouwbaar; een Disallow: / plus Anthropics gepubliceerde IP-ranges bij de firewall dekt in één handhavingslaag zowel robots.txt-lezen als niet-conform gedrag.
De beslissing: Wil je uit Claudes trainingdata, dan doet deze wijziging in één bestand het werk. Wil je Claude Computer Use ook uit je checkout houden, dan is dat een apart detectieprobleem dat browserlaag-signalen nodig heeft.

Weinig tijd? Bekijk cside's AI-agentdetectie. Dit dekt alles hieronder in één deployment.

ClaudeBot is de webcrawler die door Anthropic wordt beheerd om trainingsgegevens voor Claude te verzamelen. Het is een gedeclareerde, HTTP-gebaseerde crawler: het identificeert zichzelf, werkt vanuit gepubliceerde IP-ranges en is ontworpen om robots.txt-richtlijnen te respecteren. Het blokkeren ervan is technisch eenvoudig.

De belangrijkere context: het blokkeren van ClaudeBot pakt Anthropics pijplijn voor trainingsgegevens aan. Het heeft geen effect op door Claude aangedreven agenten, tools of producten die namens gebruikers het web doorzoeken. Dat zijn aparte systemen die detectie op browserniveau vereisen. Voor het bredere patroon over AI-scrapers heen, zie onze gids voor het blokkeren van AI-agent content-scraping-bots.

Wat Is ClaudeBot?

Snel antwoord: ClaudeBot is Anthropics trainingscrawler. Het verzamelt publiek beschikbare webcontent om Claude-modellen te trainen en te verbeteren. Het gebruikt een gedeclareerde user-agent-string en staat vermeld in Anthropics openbare documentatie samen met zijn IP-ranges. Het is een HTTP-crawler, geen interactieve browseragent.

De primaire user-agent-identifier van ClaudeBot is Claude-Web/1.0, met een verwijzing naar Anthropics crawlerdocumentatiepagina. Anthropic onderhoudt documentatie die het doel, het gedrag en de manier waarop je de crawler blokkeert beschrijft.

Net als GPTBot voert ClaudeBot geen JavaScript uit en interageert het niet met interfaces van webapplicaties. Het doet HTTP GET-verzoeken aan publiek toegankelijke URL's, leest de respons en gaat verder. Het logt niet in, vult geen formulieren in en navigeert niet door interactieve elementen.

Hoe Blokkeer Je ClaudeBot met robots.txt

Snel antwoord: Voeg ClaudeBot toe aan je robots.txt om de crawler volledig te blokkeren. Anthropics documentatie stelt dat ClaudeBot deze richtlijnen respecteert. Gebruik regels op padniveau als je alleen gevoelige secties wilt beperken terwijl je de crawler op publieke content toestaat.

Om ClaudeBot van je hele site te blokkeren:

User-agent: ClaudeBot
Disallow: /

Om de crawler op publieke content toe te staan maar gevoelige paden te beperken:

User-agent: ClaudeBot
Disallow: /account/
Disallow: /checkout/
Disallow: /admin/
Allow: /blog/
Allow: /products/

Anthropic heeft een goede reputatie op het gebied van naleving wat betreft het respecteren van robots.txt-regels door zijn crawlers. Dit is de eenvoudigste en breedst effectieve aanpak om de toegang van ClaudeBot te beheren zonder wijzigingen op infrastructuurniveau. Dezelfde robots.txt-aanpak werkt voor andere gedeclareerde crawlers, waaronder CCBot en Bytespider.

Blokkeren op IP-Niveau voor ClaudeBot

Snel antwoord: Anthropic publiceert de IP-ranges van ClaudeBot in zijn crawlerdocumentatie. Het weigeren van deze ranges op je firewall of CDN biedt handhaving die niet afhankelijk is van de crawler die robots.txt leest. Controleer de documentatie periodiek, want IP-ranges kunnen uitbreiden wanneer Anthropic zijn crawlinfrastructuur opschaalt.

Blokkeren op IP-niveau is de robuustere handhavingsoptie:

Het vangt elke versie van de crawler die robots.txt mogelijk niet correct verwerkt
Het creëert een log op serverniveau van geblokkeerde verzoeken die je kunt controleren
Het is niet afhankelijk van zelfidentificatie via de user-agent-string

De afweging: Anthropics gepubliceerde IP-ranges vereisen onderhoud. Als je ze op firewallniveau blokkeert, stel dan een herinnering in om elk kwartaal op range-updates te controleren of wanneer Anthropic changelog-vermeldingen aan zijn crawlerdocumentatie toevoegt.

ClaudeBot vs. Door Claude Aangedreven Agenten: De Kloof Die Ertoe Doet

Snel antwoord: ClaudeBot is Anthropics crawler. Claude de assistent is een ander product. Wanneer Claude een gebruiker helpt het web te doorzoeken, een onderwerp te onderzoeken of een taak te voltooien, gebruikt het andere infrastructuur dan ClaudeBot. Het blokkeren van ClaudeBot voorkomt niet dat door Claude aangedreven agenten je site bezoeken.

Dit is dezelfde structurele kloof die geldt voor GPTBot en OpenAI Operator. De trainingscrawler en de interactieve agent zijn aparte systemen.

Wanneer een gebruiker Claude vraagt om een product te onderzoeken, prijzen te vergelijken of een webgebaseerde taak te voltooien, gebruikt Claude een browsersessie of webzoektool die niet ClaudeBot is. Die sessie heeft mogelijk helemaal geen identificerende headers die het aan Anthropic koppelen. Vanuit het perspectief van je server ziet het eruit als een standaard browserverzoek.

Het juiste mentale model: robots.txt en IP-blokkering beheren je relatie met Anthropics pijplijn voor gegevensverzameling. Ze beheren niet je relatie met Claude als product dat door echte gebruikers wordt gebruikt om met je site te interageren.

Wat Gebeurt Er Nadat Je ClaudeBot Blokkeert

Snel antwoord: Het blokkeren van ClaudeBot voorkomt dat je content in Anthropics pijplijn voor trainingsgegevens terechtkomt. Het voorkomt niet dat Claude naar je site verwijst in antwoorden op basis van eerder geïndexeerde content. Het voorkomt niet dat door Claude aangedreven agentische systemen je site namens gebruikers doorzoeken.

Na een ClaudeBot-blokkering:

Toekomstige trainingsruns bevatten je nieuwe content niet
Eerder verzamelde content blijft in de gewichten van bestaande Claude-modellen
Claude-gebruikers die Claude vragen je site te bezoeken, worden niet beïnvloed
Elke door Claude aangedreven agent (Claude.ai computer use, Claude API-agenten) die je site bezoekt, wordt niet beïnvloed

De reikwijdte van een robots.txt-blokkering is smaller dan de meeste site-eigenaren verwachten. Het is een uitspraak over één specifieke crawler, geen beleid dat geldt voor het volledige productportfolio van een AI-bedrijf.

Detectie op Browserniveau Voorbij ClaudeBot

Snel antwoord: Het blokkeren van ClaudeBot is eenvoudig. Het lastigere probleem is het detecteren van door Claude aangedreven agenten die je site doorzoeken in echte browsersessies namens gebruikers, sessies die er op netwerkniveau identiek uitzien als menselijk verkeer. Dat vereist observatie op browserniveau.

Bedenk wat een door Claude aangedreven computer use-agent feitelijk doet wanneer een gebruiker het vraagt een SaaS-product te onderzoeken. Het opent een echte Chromium-sessie, laadt de prijzenpagina en scrollt door de functietabel. Op netwerkniveau ziet het verzoek er identiek uit als een menselijk bezoek: een standaard Chrome user-agent, een residentieel IP, een TLS-vingerafdruk binnen het bereik. Geen ClaudeBot-header. Geen Anthropic-IP-range. De agent navigeert in 11 seconden door vier pagina's zonder ook maar één variatie in muisbeweging, scrollt nooit terug en pauzeert nooit bij een formulierveld tenzij de taak invoer vereist. Die timingsignalen en interactiepatronen zijn alleen binnen de browsersessie detecteerbaar. cside's instrumentatie legt ze vast op de JavaScript-uitvoeringslaag voordat enige tool op netwerkniveau ze kan zien. In cside's gecontroleerde tests misten traditionele tools AI-agenten die binnen echte browsersessies opereerden in 81 van de 100 scenario's: netwerktools kijken simpelweg niet naar de juiste laag.

cside AI-agent detectiedashboard

cside werkt binnen de browsersessie en legt de gedragssignalen bloot die door agenten uitgevoerd browsen onderscheiden van menselijk gedrag. Interactietiming, navigatiepatronen, consistentie van vingerafdrukken en kenmerken van JavaScript-uitvoering zijn allemaal observeerbaar binnen een browsersessie, maar onzichtbaar voor tools op netwerkniveau. ClaudeBot zelf valt niet in die categorie: het is eenvoudig te blokkeren. De agenten die via browsersessies opereren, zijn precies wat die tests identificeerden als de onzichtbare dreiging.

Client-Side Security Consultant Mike Kutlu

Client-side security consultant at cside. 10+ years of experience implementing technology solutions for enterprises (previously at Oracle, Cloudflare, and Splunk). Now helping teams use client-side intelligence to catch & reduce fraud.

Back to top

Don't just take our word for it, ask AI

FAQ

Frequently Asked Questions

ClaudeBot is Anthropics webcrawler, gebruikt om trainingsgegevens voor Claude-modellen te verzamelen. Het doet HTTP GET-verzoeken aan publiek toegankelijke URL's, identificeert zichzelf met een gedeclareerde user-agent-string en werkt vanuit gepubliceerde IP-ranges. Het is een HTTP-crawler die geen JavaScript uitvoert en niet interageert met dynamische webapplicaties.

Voeg `User-agent: ClaudeBot` toe, gevolgd door `Disallow: /` in je `robots.txt`-bestand. Anthropics documentatie stelt dat ClaudeBot deze richtlijnen respecteert. Voor controle op padniveau gebruik je specifieke `Disallow`-regels om de toegang tot gevoelige secties te beperken terwijl je de crawler op publieke content toestaat.

Nee. ClaudeBot is Anthropics trainingscrawler. Claude de assistent is een apart product. Wanneer Claude-gebruikers Claude vragen om het web te doorzoeken of webgebaseerde taken te voltooien, gebruiken die sessies andere infrastructuur. Het blokkeren van ClaudeBot voorkomt niet dat door Claude aangedreven agenten je site bezoeken.

Ja. Anthropic publiceert de IP-ranges van ClaudeBot in zijn crawlerdocumentatie. Het weigeren van deze ranges op je firewall of CDN biedt handhaving die niet afhankelijk is van de crawler die `robots.txt` leest. IP-ranges vereisen periodieke updates naarmate Anthropic zijn crawlinfrastructuur opschaalt.

Dat hangt ervan af of je wilt dat je content in Anthropics trainingsgegevens terechtkomt. Blokkeren voorkomt dat nieuwe content in toekomstige trainingsruns terechtkomt, maar verwijdert eerder verzamelde content niet uit bestaande Claude-modellen. Weeg de afweging tussen gegevensbescherming en het potentiële voordeel van goed vertegenwoordigd zijn in Claudes kennisbank.

Monitor en beveilig je third-party scripts

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Boek een demo

Start gratis

Start gratis, of probeer Business met een proefperiode van 14 dagen.

cside-dashboardinterface met scriptmonitoring en beveiligingsanalyses

Botbescherming in 2026: waarom detectie in de browserlaag vangt wat WAF's missen

AI-agents draaien in echte Chromium-browsers en glippen langs WAF's. Detectie in de browserlaag leest canvas-entropie en sessieritme om ze te vangen.

Chargebackfraude voorkomen: hoe apparaatbewijs geschillen wint in 2026

Chargebackfraude voorkomen draait om apparaatbewijs dat je bij het afrekenen vastlegt, wat Visa CE 3.0 accepteert bij een card-not-present-geschil.

Accountovername-oplossingen: begrijp de categorie voordat je een shortlist opstelt

Accountovername-oplossingen kennen vier lagen: WAF, MFA, browser-device-intelligence en gedragsanalyse. Geen enkele leverancier dekt ze allemaal.

Beste software voor detectie van accountdeling 2026: een eerlijke vergelijking

Device-fingerprinting telt hoeveel verschillende apparaten achter één login zitten en vangt het zetelmisbruik dat IP-tools en MFA missen.

Detectie van nepaccounts: waarom e-mailverificatie in 2026 niet genoeg is

E-mailverificatie en CAPTCHA bevestigen een endpoint, geen persoon. Device fingerprinting vangt nepaccount-aanmeldingen bij registratie.

Beste VPN-detectiesoftware 2026: TLS handshake fingerprint TLS-fingerprinting vs IP-blocklists

De beste VPN-detectietools gebruiken TLS handshake fingerprint TLS-fingerprinting om de residentiële proxy's en VPN-configuraties te vangen die IP-blocklists volledig missen.

PCI DSS-compliancechecklist 2026: vereisten 6.4.3 en 11.6.1 uitgelegd

Vereisten 6.4.3 en 11.6.1 werden verplicht in maart 2025. Dit hoort op een moderne PCI DSS-compliancechecklist, en zo automatiseer je het.

Software om card testing-fraude te voorkomen: geautomatiseerde kaartvalidatie bij de checkout stoppen

Zie hoe browserlaag-detectie geautomatiseerde card testing bij de checkout stopt via sessiegedrag, AI-agentsignalen en device fingerprinting.

Wat is formjacking? Hoe het werkt en hoe je het detecteert

Formjacking injecteert kwaadaardige JavaScript in afrekenpagina's om kaartdata te stelen tijdens het typen, onzichtbaar voor WAF's en CSP's. Zo detecteer je het.

Wat is credential stuffing? Definitie, voorbeelden en detectie

Credential stuffing test gestolen inloggegevens uit datalekken op andere sites. Ontdek hoe het werkt en hoe apparaatsignalen het betrappen.