Blog Attacks

Hoe Blokkeer Je PerplexityBot op Je Website

PerplexityBot crawlt je content voor AI-zoekresultaten. Zo blokkeer je het, waarom het kritiek op auteursrecht kreeg en hoe Perplexity Shopper verschilt.

Jun 25, 2026 • 6 min read

Mike Kutlu Client-Side Security Consultant

Hoe Blokkeer Je PerplexityBot op Je Website

PerplexityBot is de gedeclareerde webcrawler die de AI-zoekmachine van Perplexity aandrijft. Wanneer een gebruiker een vraag stelt aan Perplexity, putten de zoekresultaten uit content die PerplexityBot heeft geïndexeerd. In 2024 meldden meerdere uitgevers dat Perplexity auteursrechtelijk beschermde content van hun sites in zoekresultaten reproduceerde ondanks robots.txt-blokkeringen, waarmee PerplexityBot een van de meer controversiële AI-crawlers werd om te blokkeren.

Deze gids gaat specifiek over PerplexityBot. Als je de shopping agent van Perplexity wilt beheersen, zie dan onze begeleidende post over hoe je Perplexity Shopper blokkeert, want dat vereist een volledig andere aanpak. Voor het bredere patroon over gedeclareerde crawlers heen, zie onze gids voor het blokkeren van AI-content-scrapers.

Wat Is PerplexityBot?

Snel antwoord: PerplexityBot is de AI-zoekcrawler van Perplexity. Het indexeert webcontent om de door AI gegenereerde zoekresultaten van Perplexity aan te drijven. Het identificeert zichzelf met een gedeclareerde user-agent-string en is gedocumenteerd op docs.perplexity.ai. In 2024 kreeg het aanzienlijke kritiek van uitgevers vanwege schijnbare niet-naleving van robots.txt en reproductie van content zonder voldoende bronvermelding.

De user-agent van PerplexityBot: PerplexityBot/1.0 (+https://docs.perplexity.ai/docs/perplexitybot)

De controverse van 2024 is relevante context voor je blokkeringsbeslissing. Meerdere grote uitgevers, waaronder mediabedrijven en nieuwsorganisaties, meldden dat Perplexity gedetailleerde reproducties van hun content achter een betaalmuur of via robots.txt afgeschermd in AI-zoekantwoorden naar voren bracht. Perplexity betwistte sommige van deze karakteriseringen, maar de kwestie stelde vast dat de naleving van PerplexityBot actiever wordt aangevochten dan die van GPTBot of ClaudeBot.

De Nalevingscontroverse van 2024

Snel antwoord: In 2024 meldden Wired, The Atlantic en andere uitgevers dat Perplexity content van hun sites in AI-zoekresultaten reproduceerde ondanks Disallow: PerplexityBot in hun robots.txt. De verklaringen van Perplexity destijds waren inconsistent, wat ertoe leidde dat verschillende uitgevers aanvullende technische en juridische stappen ondernamen.

De specifieke zorg betrof niet alleen het crawlen, maar de samenvatting en reproductie. Zelfs als PerplexityBot robots.txt respecteerde voor zijn directe crawl, kon Perplexity dezelfde content via andere wegen benaderen en samenvatten: gecachte kopieën, gegevensbronnen van derden of live browsing-infrastructuur. Het netto resultaat was vanuit het perspectief van uitgevers dat hun content in Perplexity-antwoorden verscheen ongeacht hun robots.txt-instellingen.

Dit betekent niet dat robots.txt-blokkering zinloos is voor PerplexityBot. Het betekent dat de reikwijdte van wat robots.txt kan bereiken tegen een zoekproduct met meerdere kanalen voor contentverwerving beperkt is. Blokkering op IP-niveau en actieve monitoring bieden betrouwbaardere handhaving.

Hoe Blokkeer Je PerplexityBot met robots.txt

Snel antwoord: Voeg PerplexityBot toe aan je robots.txt. Gezien de nalevingscontroverse van 2024 implementeer je ook blokkering op IP-niveau en overweeg je om juridische bepalingen aan je gebruiksvoorwaarden toe te voegen die het verzamelen van AI-trainingsgegevens en AI-zoeksamenvattingen expliciet beperken.

Om PerplexityBot van je hele site te blokkeren:

User-agent: PerplexityBot
Disallow: /

Voor controle op padniveau:

User-agent: PerplexityBot
Disallow: /premium/
Disallow: /members/
Disallow: /api/
Allow: /public/

Gezien de controverse van 2024 behandel je robots.txt voor PerplexityBot als een signaal van intentie in plaats van een harde technische beheersmaatregel. Dezelfde aanpak voor gedeclareerde crawlers is betrouwbaarder voor crawlers met een schonere nalevingsgeschiedenis, zoals CCBot.

Blokkeren op IP-Niveau

Snel antwoord: Perplexity publiceert de IP-ranges van PerplexityBot in zijn documentatie. Het weigeren van deze ranges op firewall- of CDN-niveau biedt handhaving die onafhankelijk is van de vraag of de crawler robots.txt leest. Voor uitgevers of content-intensieve sites is blokkering op IP-niveau de betrouwbaardere aanpak gezien de nalevingsgeschiedenis.

Zoek de actuele IP-ranges van Perplexity op in hun officiële documentatie op docs.perplexity.ai. Voeg ze toe aan je firewall, je CDN-edge-configuratie of de deny-regels van je reverse proxy. Bekijk deze lijst elk kwartaal, want de IP-ranges van crawlinfrastructuur breiden uit naarmate het crawlvolume groeit.

PerplexityBot vs. Perplexity Shopper: Een Cruciaal Onderscheid

Snel antwoord: PerplexityBot (de indexerende crawler) en Perplexity Shopper (de transactie-uitvoerende agent) zijn aparte systemen. Het blokkeren van PerplexityBot heeft geen effect op Perplexity Shopper. Shopper gebruikt een echte browsersessie met een standaard Chrome user-agent. Het vereist detectie op browserniveau, geen robots.txt-blokkering.

Systeem	Doel	User-agent	Detectieaanpak
PerplexityBot	Crawlt en indexeert content	`PerplexityBot/1.0` (gedeclareerd)	robots.txt + IP-blokkering
Perplexity Shopper	Voltooit aankopen voor gebruikers	Standaard Chrome (niet-gedeclareerd)	Gedragssignalen op browserniveau

Engineers die PerplexityBot aan robots.txt toevoegen en het Perplexity-probleem als opgelost beschouwen, hebben één van de twee systemen aangepakt. Perplexity Shopper is onzichtbaar voor alles in de blocklist-aanpak. In cside's gecontroleerde tests misten traditionele tools AI-agenten die binnen echte browsersessies opereerden in 81 van de 100 scenario's, en Shopper is precies het soort sessie dat die tools missen.

cside AI-agent detectiedashboard

Hoe dat er in de praktijk uitziet: een Perplexity Shopper-sessie met de opdracht om een specifiek product te kopen, opent een echte Chrome-sessie, navigeert naar de categoriepagina van een retailer, filtert op de gevraagde specificatie, selecteert een product en gaat door naar de checkout. Elk signaal op netwerkniveau is schoon: een residentieel IP, een standaard TLS-handshake en een Chrome user-agent-string die niet te onderscheiden is van een menselijke shopper. De verraderlijke aanwijzing zit in de browserlaag. De agent doorloopt de productfiltering in 3,2 seconden zonder enige variatie in cursorbeweging, selecteert het eerste in aanmerking komende resultaat zonder te pauzeren om alternatieven te vergelijken, en voert adresgegevens in met een uniform toetsaanslaginterval van 80 ms zonder correctiegebeurtenissen. cside's instrumentatie legt die anomalieën op de interactielaag vast voordat enige checkout-gebeurtenis wordt geactiveerd, waardoor operators inzicht krijgen dat de netwerklaag nooit biedt.

Wat Het Blokkeren van PerplexityBot Daadwerkelijk Bereikt

Snel antwoord: Een PerplexityBot-blokkering voorkomt dat de gedeclareerde crawler je content rechtstreeks indexeert in toekomstige crawlruns. Het voorkomt niet dat Perplexity naar eerder geïndexeerde content verwijst, je content via bronnen van derden benadert of samenvattingen in AI-zoekresultaten naar voren brengt via andere kanalen dan directe crawling.

Dit is de beperking die de controverse van 2024 blootlegde. Robots.txt blokkeert een specifieke crawler van het doen van nieuwe verzoeken. Het wist geen bestaande geïndexeerde content uit de kennisbank van een zoekproduct, en het voorkomt geen contentverwerving via alternatieve kanalen die de crawler zelf niet rechtstreeks gebruikt.

Voor organisaties met strikte eisen (content achter een betaalmuur, eigen onderzoek, gelicentieerd materiaal) biedt de combinatie van robots.txt, IP-blokkering, juridische bepalingen in de gebruiksvoorwaarden en technische contentbescherming zoals authenticatiemuren en dynamische rendering een vollediger beschermingspositie dan welke afzonderlijke aanpak dan ook.

Client-Side Security Consultant Mike Kutlu

Client-side security consultant at cside. 10+ years of experience implementing technology solutions for enterprises (previously at Oracle, Cloudflare, and Splunk). Now helping teams use client-side intelligence to catch & reduce fraud.

Back to top

Don't just take our word for it, ask AI

FAQ

Frequently Asked Questions

PerplexityBot is de webcrawler van Perplexity die content indexeert voor zijn AI-zoekmachine. Wanneer gebruikers een vraag stellen aan Perplexity, putten de door AI gegenereerde antwoorden uit content die PerplexityBot heeft verzameld. In 2024 meldden meerdere uitgevers nalevingsproblemen waarbij hun via robots.txt afgeschermde content in Perplexity-antwoorden verscheen ondanks expliciete botblokkering.

Voeg `User-agent: PerplexityBot` toe, gevolgd door `Disallow: /` in je `robots.txt`-bestand. Gezien de nalevingscontroverse van 2024 vul je dit aan met blokkering op IP-niveau met behulp van de door Perplexity gepubliceerde IP-ranges uit hun crawlerdocumentatie. Behandel `robots.txt` voor deze specifieke crawler als een signaal van intentie in plaats van een harde technische beheersmaatregel.

Meerdere uitgevers meldden in 2024 dat Perplexity gedetailleerde samenvattingen van hun content in AI-zoekresultaten naar voren bracht ondanks robots.txt-blokkeringen op PerplexityBot. Perplexity betwistte aspecten van deze meldingen. De kwestie werd gedocumenteerd in berichtgeving van Wired, The Atlantic en andere media, en stelde vast dat de naleving van PerplexityBot actiever wordt aangevochten dan die van de meeste andere grote AI-crawlers.

PerplexityBot is een indexerende crawler met een gedeclareerde user-agent. Perplexity Shopper is een transactie-uitvoerende agent die een echte browsersessie gebruikt en zich presenteert met een standaard Chrome user-agent. Het blokkeren van PerplexityBot heeft geen effect op Perplexity Shopper. Shopper-sessies vereisen gedragsdetectie op browserniveau om ze te identificeren en te beheersen.

Juridische strategieën verschillen per rechtsgebied en per type content. Het toevoegen van expliciete bepalingen in je gebruiksvoorwaarden die het verzamelen van AI-trainingsgegevens en AI-zoeksamenvattingen verbieden, creëert een juridische basis voor handhaving die technische blokkering aanvult. In de periode 2024-2025 hebben uitgevers zowel juridische argumenten op basis van gebruiksvoorwaarden als op basis van auteursrecht aangevoerd. Dit is een actief juridisch terrein en specifieke richtlijnen hangen af van het rechtsgebied en het type content.

Monitor en Beveilig Je Third-Party Scripts

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Boek een demo

Start gratis

Start gratis, of probeer Business met een proefperiode van 14 dagen.

cside dashboard interface met script monitoring en beveiligingsanalytics

Hoe u account sharing in luchtvaart loyaliteitsprogramma's stopt: inloggegevensmisbruik detecteren zonder frequente vliegers te markeren

Frequent flyer-accounts worden gedeeld in drie afzonderlijke patronen, elk met verschillende omzet- en nalevingsimplicaties.

Hoe Blokkeer Je PerplexityBot op Je Website

PerplexityBot crawlt je content voor AI-zoekresultaten. Zo blokkeer je het, waarom het kritiek op auteursrecht kreeg en hoe Perplexity Shopper verschilt.

Schaduw GTM-containers op gokplatforms van meerdere merken: wat ze zijn en hoe u ze kunt detecteren

Ongeautoriseerde GTM-containers kunnen elke JavaScript uitvoeren op uw gokdomeinen. Hoe schaduwcontainers verschijnen en waarom tools ze missen.

Hoe je account sharing detecteert en voorkomt zonder legitieme gebruikers te schaden

Het grootste bezwaar tegen account sharing-detectie is fout-positieven: wat als we een abonnee markeren die gewoon meerdere apparaten gebruikt?

Hoe Blokkeer Je GPTBot (en Waarom Je Dat Misschien Niet Wilt)

GPTBot crawlt je site om OpenAI-modellen te trainen. Zo blokkeer je het met robots.txt en IP-ranges, en wat die blokkering nog steeds laat liggen.

Donkere cside-blogcover met een blauwe pixelgolf en een checklist over sessierecordingtools en risico op PII-exfiltratie

Session recording-tools op goksites: het PII-exfiltratierisico dat operators missen

Session recording-tools op goksites kunnen stilzwijgend PII van spelers exfiltreren bij misconfiguratie of compromittering. Dit zijn de drie manieren.

Account sharing detectie: hoe de handhavingskloof te sluiten die gelijktijdige sessielimieten missen

Gelijktijdige sessielimieten signaleren het voor de hand liggende geval.

Een vloeiend gloeiend blauw cursorpad naast een hoekig rood botpad op een donker vlak.

Bots betrappen op hoe ze bewegen: gedragsmatige cursordetectie

Hoe het cursor_v2-model van cside muisbeweging scoort om de stealth-bots te vangen die fingerprint- en IP-controles al omzeilen.

Hoe Applebot-Extended op Je Website te Blokkeren

Applebot-Extended is Apples AI-trainingscrawler die Apple Intelligence voedt. Leer hoe het verschilt van Applebot en hoe je je afmeldt via robots.txt.

Donkere cside-blogcover met een blauwe pixelgolf en een checklist over monitoring van scripts van derden op casinodomeinen

Hoe u scripts van derden kunt monitoren in 100 of meer casinodomeinen

Gids voor het monitoren van scripts van derden op 100+ casinodomeinen: scriptwildgroei, waarschuwingen tussen domeinen en schalen met cside.