Blog Attacks

Comment Bloquer ClaudeBot sur Votre Site Web

ClaudeBot explore votre site pour entraîner les modèles Claude d'Anthropic. Voici comment le bloquer via robots.txt et plages d'IP, et ce qui échappe encore au blocage.

Jun 16, 2026 • 8 min read

Mike Kutlu Client-Side Security Consultant

Comment Bloquer ClaudeBot sur Votre Site Web

En bref : bloquer ClaudeBot sans empêcher les agents Claude de naviguer sur votre site

Crawler contre agent : Les équipes bloquent ClaudeBot en s'attendant à ce que Claude disparaisse de leur site, puis Claude Computer Use entre le lendemain. ClaudeBot est le crawler d'entraînement d'Anthropic; les agents propulsés par Claude qui naviguent sur le web utilisent une infrastructure et des user-agents différents.
Le blocage robots.txt : ClaudeBot s'identifie comme Claude-Web/1.0, est documenté dans les pages crawler d'Anthropic et respecte robots.txt de manière fiable; un Disallow: / associé aux plages IP publiées d'Anthropic au pare-feu couvre en une seule couche d'application la lecture de robots.txt et les comportements non conformes.
La décision : Si vous voulez sortir des données d'entraînement de Claude, ce changement d'un fichier suffit. Si vous voulez aussi garder Claude Computer Use hors de votre checkout, c'est un problème de détection distinct qui nécessite des signaux au niveau navigateur.

Peu de temps ? Découvrez la détection d'agents IA de cside. Elle couvre tout ce qui suit en un seul déploiement.

ClaudeBot est le robot d'exploration web exploité par Anthropic pour collecter des données d'entraînement pour Claude. C'est un robot déclaré et basé sur HTTP : il s'identifie, opère à partir de plages d'IP publiées et est conçu pour respecter les directives robots.txt. Le bloquer est techniquement simple.

Le contexte le plus important : bloquer ClaudeBot agit sur le pipeline de données d'entraînement d'Anthropic. Cela n'a aucun effet sur les agents, outils ou produits propulsés par Claude qui naviguent sur le web pour le compte des utilisateurs. Ce sont des systèmes distincts qui nécessitent une détection au niveau du navigateur. Pour le schéma plus large applicable aux scrapers IA, consultez notre guide pour bloquer les bots d'agents IA qui scrapent le contenu.

Qu'est-ce que ClaudeBot ?

Réponse rapide : ClaudeBot est le robot d'entraînement d'Anthropic. Il collecte du contenu web accessible au public pour entraîner et améliorer les modèles Claude. Il utilise une chaîne d'agent utilisateur déclarée et figure dans la documentation publique d'Anthropic, accompagnée de ses plages d'IP. C'est un robot d'exploration HTTP, et non un agent navigateur interactif.

L'identifiant d'agent utilisateur principal de ClaudeBot est Claude-Web/1.0, accompagné d'une référence à la page de documentation d'Anthropic sur les robots d'exploration. Anthropic maintient une documentation décrivant l'objectif et le comportement du robot, ainsi que la manière de le bloquer.

Comme GPTBot, ClaudeBot n'exécute pas JavaScript et n'interagit pas avec les interfaces des applications web. Il effectue des requêtes HTTP GET vers des URL accessibles au public, lit la réponse et passe à la suivante. Il ne se connecte pas, ne remplit pas de formulaires et ne navigue pas dans les éléments interactifs.

Comment Bloquer ClaudeBot avec robots.txt

Réponse rapide : Ajoutez ClaudeBot à votre robots.txt pour bloquer entièrement le robot. La documentation d'Anthropic indique que ClaudeBot respecte ces directives. Utilisez des règles au niveau des chemins si vous souhaitez restreindre uniquement les sections sensibles tout en autorisant le robot sur le contenu public.

Pour bloquer ClaudeBot sur l'ensemble de votre site :

User-agent: ClaudeBot
Disallow: /

Pour autoriser le robot sur le contenu public tout en restreignant les chemins sensibles :

User-agent: ClaudeBot
Disallow: /account/
Disallow: /checkout/
Disallow: /admin/
Allow: /blog/
Allow: /products/

Anthropic jouit d'une bonne réputation de conformité, ses robots respectant les règles robots.txt. C'est l'approche la plus simple et la plus largement efficace pour contrôler l'accès de ClaudeBot sans modifications au niveau de l'infrastructure. La même approche robots.txt fonctionne pour d'autres robots déclarés, notamment CCBot et Bytespider.

Blocage au Niveau de l'IP pour ClaudeBot

Réponse rapide : Anthropic publie les plages d'IP de ClaudeBot dans sa documentation sur les robots d'exploration. Refuser ces plages au niveau de votre pare-feu ou de votre CDN fournit une application qui ne dépend pas du fait que le robot lise robots.txt. Consultez la documentation périodiquement, car les plages d'IP peuvent s'étendre lorsqu'Anthropic fait évoluer son infrastructure d'exploration.

Le blocage au niveau de l'IP est l'option d'application la plus robuste :

Il intercepte toute version du robot qui pourrait ne pas gérer correctement robots.txt
Il crée un journal au niveau du serveur des requêtes bloquées que vous pouvez auditer
Il ne repose pas sur l'auto-identification via la chaîne d'agent utilisateur

Le compromis : les plages d'IP publiées par Anthropic nécessitent une maintenance. Si vous les bloquez au niveau du pare-feu, programmez un rappel pour vérifier les mises à jour des plages chaque trimestre ou lorsqu'Anthropic publie des entrées de changelog dans sa documentation sur les robots d'exploration.

ClaudeBot vs. Agents Propulsés par Claude : la Lacune qui Compte

Réponse rapide : ClaudeBot est le robot d'exploration d'Anthropic. Claude, l'assistant, est un produit différent. Lorsque Claude aide un utilisateur à naviguer sur le web, à faire des recherches sur un sujet ou à accomplir une tâche, il utilise une infrastructure différente de ClaudeBot. Bloquer ClaudeBot n'empêche pas les agents propulsés par Claude de visiter votre site.

C'est la même lacune structurelle qui s'applique à GPTBot et à OpenAI Operator. Le robot d'entraînement et l'agent interactif sont des systèmes distincts.

Lorsqu'un utilisateur demande à Claude de faire des recherches sur un produit, de comparer des prix ou d'accomplir une tâche web, Claude utilise une session de navigateur ou un outil de recherche web qui n'est pas ClaudeBot. Cette session peut n'avoir aucun en-tête d'identification la reliant à Anthropic. Du point de vue de votre serveur, elle ressemble à une requête de navigateur standard.

Le bon modèle mental : robots.txt et le blocage d'IP gèrent votre relation avec le pipeline de collecte de données d'Anthropic. Ils ne gèrent pas votre relation avec Claude en tant que produit utilisé par de vrais utilisateurs pour interagir avec votre site.

Ce qui se Passe Après Avoir Bloqué ClaudeBot

Réponse rapide : Bloquer ClaudeBot empêche votre contenu d'entrer dans le pipeline de données d'entraînement d'Anthropic. Cela n'empêche pas Claude de référencer votre site dans ses réponses sur la base de contenu déjà indexé. Cela n'empêche pas les systèmes agentiques propulsés par Claude de naviguer sur votre site pour le compte des utilisateurs.

Après un blocage de ClaudeBot :

Les futurs cycles d'entraînement n'incluront pas votre nouveau contenu
Le contenu déjà collecté reste dans les poids des modèles Claude existants
Les utilisateurs de Claude qui lui demandent de naviguer sur votre site ne sont pas affectés
Tout agent propulsé par Claude (utilisation d'ordinateur sur Claude.ai, agents de l'API Claude) qui visite votre site n'est pas affecté

La portée d'un blocage robots.txt est plus étroite que ne le pensent la plupart des propriétaires de sites. C'est une déclaration concernant un robot d'exploration spécifique, et non une politique qui s'applique à l'ensemble du portefeuille de produits d'une entreprise d'IA.

Détection au Niveau du Navigateur, Au-Delà de ClaudeBot

Réponse rapide : Bloquer ClaudeBot est simple. Le problème plus difficile est de détecter les agents propulsés par Claude qui naviguent sur votre site dans de vraies sessions de navigateur pour le compte des utilisateurs, des sessions qui ressemblent en tout point au trafic humain au niveau du réseau. Cela nécessite une observation au niveau du navigateur.

Considérez ce que fait réellement un agent d'utilisation d'ordinateur propulsé par Claude lorsqu'un utilisateur lui demande de faire des recherches sur un produit SaaS. Il ouvre une vraie session Chromium, charge la page de tarification et fait défiler le tableau des fonctionnalités. Au niveau du réseau, la requête ressemble en tout point à une visite humaine : un agent utilisateur Chrome standard, une IP résidentielle, une empreinte TLS dans la plage attendue. Aucun en-tête ClaudeBot. Aucune plage d'IP d'Anthropic. L'agent navigue dans quatre pages en 11 secondes sans la moindre variance de mouvement de souris, ne revient jamais en arrière et ne s'arrête jamais sur un champ de formulaire sauf si la tâche exige une saisie. Ces signaux de timing et ces modèles d'interaction ne sont détectables qu'à l'intérieur de la session du navigateur. L'instrumentation de cside les capture au niveau de l'exécution JavaScript avant que tout outil au niveau du réseau ne puisse les voir. Lors des tests contrôlés de cside, les outils traditionnels ont raté des agents IA opérant dans de vraies sessions de navigateur dans 81 scénarios sur 100 : les outils réseau n'observent tout simplement pas la bonne couche.

Tableau de bord de détection d'agents IA de cside

cside opère à l'intérieur de la session du navigateur et fait remonter les signaux comportementaux qui distinguent la navigation exécutée par un agent du comportement humain. Le timing des interactions, les modèles de navigation, la cohérence des empreintes digitales et les caractéristiques d'exécution de JavaScript sont tous observables à l'intérieur d'une session de navigateur, mais invisibles pour les outils au niveau du réseau. ClaudeBot lui-même n'entre pas dans cette catégorie : il se bloque facilement. Les agents qui opèrent au travers de sessions de navigateur sont précisément ce que ces tests ont identifié comme la menace invisible.

Client-Side Security Consultant Mike Kutlu

Client-side security consultant at cside. 10+ years of experience implementing technology solutions for enterprises (previously at Oracle, Cloudflare, and Splunk). Now helping teams use client-side intelligence to catch & reduce fraud.

Don't just take our word for it, ask AI

FAQ

Frequently Asked Questions

ClaudeBot est le robot d'exploration web d'Anthropic, utilisé pour collecter des données d'entraînement pour les modèles Claude. Il effectue des requêtes HTTP GET vers des URL accessibles au public, s'identifie au moyen d'une chaîne d'agent utilisateur déclarée et opère à partir de plages d'IP publiées. C'est un robot d'exploration HTTP qui n'exécute pas JavaScript et n'interagit pas avec les applications web dynamiques.

Ajoutez `User-agent: ClaudeBot` suivi de `Disallow: /` à votre fichier `robots.txt`. La documentation d'Anthropic indique que ClaudeBot respecte ces directives. Pour un contrôle au niveau des chemins, utilisez des règles `Disallow` spécifiques afin de restreindre l'accès aux sections sensibles tout en autorisant le robot sur le contenu public.

Non. ClaudeBot est le robot d'entraînement d'Anthropic. Claude, l'assistant, est un produit distinct. Lorsque les utilisateurs de Claude lui demandent de naviguer sur le web ou d'accomplir des tâches web, ces sessions utilisent une infrastructure différente. Bloquer ClaudeBot n'empêche pas les agents propulsés par Claude de visiter votre site.

Oui. Anthropic publie les plages d'IP de ClaudeBot dans sa documentation sur les robots d'exploration. Refuser ces plages au niveau de votre pare-feu ou de votre CDN fournit une application qui ne dépend pas du fait que le robot lise `robots.txt`. Les plages d'IP nécessitent des mises à jour périodiques à mesure qu'Anthropic fait évoluer son infrastructure d'exploration.

Cela dépend de votre volonté de voir votre contenu figurer dans les données d'entraînement d'Anthropic. Le bloquer empêche le nouveau contenu d'entrer dans les futurs cycles d'entraînement, mais ne supprime pas le contenu déjà collecté des modèles Claude existants. Pesez le compromis entre la protection de vos données et l'avantage potentiel d'être bien représenté dans la base de connaissances de Claude.

Surveillez et sécurisez vos scripts tiers

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Réserver une démonstration

Commencez gratuitement

Commencez gratuitement, ou essayez Business avec un essai de 14 jours.

Interface du tableau de bord cside affichant la surveillance des scripts et les analyses de sécurité

Protection contre les bots en 2026 : pourquoi la détection au niveau du navigateur repère ce que les WAF laissent passer

Les agents IA tournent dans de vrais navigateurs Chromium et déjouent les WAF. La détection navigateur lit l'entropie du canvas et la cadence de session pour les repérer.

Prévention de la fraude à la rétrofacturation : comment les preuves d'appareil gagnent les litiges en 2026

La prévention de la fraude à la rétrofacturation repose sur les preuves d'appareil captées au paiement, la preuve que Visa CE 3.0 accepte en litige.

Solutions de prise de contrôle de compte : comprendre la catégorie avant de dresser une liste restreinte

Les solutions de prise de contrôle de compte couvrent quatre couches : WAF, MFA, intelligence des appareils navigateur et analyse comportementale. Aucun éditeur ne les couvre toutes.

Meilleur logiciel de détection du partage de comptes 2026 : une comparaison honnête

Le fingerprinting d'appareil compte les appareils distincts derrière une connexion et repère l'abus de licences que les outils IP et la MFA manquent.

Détection des faux comptes : pourquoi la vérification par e-mail ne suffit pas en 2026

La vérification par e-mail et le CAPTCHA confirment un terminal, pas une personne. L'empreinte d'appareil détecte les inscriptions de faux comptes.

Meilleur logiciel de détection de VPN 2026 : empreinte TLS TLS handshake fingerprint vs listes de blocage d'IP

Les meilleurs outils de détection de VPN utilisent l'empreinte TLS TLS handshake fingerprint pour repérer les proxys résidentiels et VPN que les listes d'IP ignorent.

Checklist de conformité PCI DSS 2026 : les exigences 6.4.3 et 11.6.1 expliquées

Les exigences 6.4.3 et 11.6.1 sont obligatoires depuis mars 2025. Voici ce qui figure sur une checklist PCI DSS moderne, et comment l'automatiser.

Logiciel de prévention de la fraude au test de cartes : comment stopper la validation automatisée de cartes au paiement

La détection navigateur stoppe le test de cartes automatisé au paiement via le comportement de session, les signaux d'agents IA et l'empreinte d'appareil.

Qu'est-ce que le formjacking ? Comment ça fonctionne et comment le détecter

Le formjacking injecte du JavaScript dans les pages de paiement pour voler les données de carte saisies, invisible aux WAF et CSP. Comment le détecter.

Qu'est-ce que le credential stuffing ? Définition, exemples et détection

Le credential stuffing teste des paires identifiant/mot de passe volées lors de fuites sur d'autres sites. Découvrez son fonctionnement et sa détection.