Blog

Por que crawlers não podem ajudar com conformidade PCI (sozinhos)

Crawlers agem como um usuário, mas claramente não são um usuário humano real. Se um script malicioso for injetado devido a uma interação do usuário, o crawler não verá o script malicioso a menos que faça essa interação do usuário

Jul 03, 2025 • 7 min read

Simon Wijckmans Founder & CEO

Nossa página de comparação mostra uma ótima visão geral das diferentes abordagens para alcançar segurança do lado do cliente e atender aos requisitos do PCI DSS (6.4.3 e 11.6.1).

Nossa solução (o proxy híbrido) supera outras abordagens em várias categorias. Vamos compará-la ao crawler que muitos concorrentes neste espaço usam. Os benefícios e as muitas deficiências que vêm com esta solução.

Neste artigo, vamos focar nas seções 6.4.3 e 11.6.1 do PCI DSS 4.0.1. Visite nossa página de comparação para obter os benefícios completos e desvantagens em um contexto de segurança completo.

Página de comparação da cside resumindo a cobertura PCI DSS em relação a outras soluções

"Um método é implementado para confirmar que cada script é autorizado"

6.4.3 Todos os scripts de página de pagamento que são carregados e executados no navegador do consumidor são gerenciados da seguinte forma:

Um método é implementado para confirmar que cada script é autorizado.

Um método é implementado para garantir a integridade de cada script.

Um inventário de todos os scripts é mantido com justificativa comercial ou técnica por escrito sobre por que cada um é necessário.

O requisito PCI 6.4.3 requer um mecanismo para impedir que scripts não autorizados sejam carregados.

Para remover qualquer confusão, a especificação PCI também afirma:

Código não autorizado não pode ser executado na página de pagamento conforme é renderizado no navegador do consumidor.

Para muitos GRCs, é um desafio alocar esforços de engenharia para requisitos de conformidade. Entender como os requisitos PCI de segurança do lado do cliente se traduzem em implementação prática é frequentemente onde as equipes ficam presas. Algumas soluções podem levá-lo a acreditar que você pode atender aos requisitos sem implementar nenhum código ou fazer quaisquer ajustes. Isso, no entanto, não está correto.

Este requisito pode ser alcançado de várias maneiras. Um comerciante pode implementar uma Content Security Policy. CSP, no entanto, é conhecida por ser difícil de gerenciar e manter, mas é uma solução válida para atender a este requisito.

Um comerciante pode optar por usar um agente do lado do cliente que bloqueia alguns comportamentos de JS. No entanto, isso não é uma solução mágica. Houve vários exemplos de ataques do lado do cliente que essencialmente impediram o agente de segurança de funcionar e desabilitaram total ou parcialmente sua funcionalidade, incluindo capacidade de bloqueio. Portanto, sempre teste a solução que você adquire com um script do lado do cliente escrito por você mesmo. Infelizmente, a maioria dos engenheiros JavaScript de nível médio não achará isso um grande desafio.

Ou, você pode usar um serviço de proxy como o cside para impedir que um script malicioso seja servido em primeiro lugar.

Esta linha específica dos requisitos do PCI DSS é facilmente negligenciada, mas remete à natureza do requisito: implementar padrões de segurança de cartão de pagamento para impedir que cartões de crédito sejam roubados na entrada.

Crawlers não 'veem' a carga útil real e não capturarão um ataque sério

Crawlers funcionam visitando seu site e indexando quais scripts são carregados. Detalhe importante, eles agem como um usuário, mas claramente não são um usuário humano real. Existem vários indicadores simples, vindo do endereço IP de um provedor de nuvem sendo um deles. Esta é uma falha fundamental de design, porque a entrega de JavaScript é dinâmica por design. É construída para servir diferentes versões de scripts com base no tempo, user-agent, localização, faixas de IP...

Atores mal-intencionados, é claro, aproveitam essa dinâmica para evitar detecção. É improvável que um crawler detecte o ataque real em primeira mão. Portanto, a inteligência de ameaças deve vir de outras fontes. É aqui que a maioria das soluções compra inteligência de feed de ameaças de provedores. Esses provedores, no entanto, tendem a chegar atrasados ao show. Quando o ataque Polyfill aconteceu, levou mais de 30 horas para qualquer fornecedor de ameaças sinalizá-lo, mesmo que tivesse ampla cobertura da imprensa. O domínio só foi sinalizado quando a Namecheap já havia derrubado o domínio. Provedores de feed de ameaças também não estão especificamente à procura de ataques do lado do cliente, às vezes eles os capturam, mas igualmente atores mal-intencionados sabem evitar seus pesquisadores. A maior parte de sua inteligência de ataque do lado do cliente se origina das redes sociais.

Estabelecemos que um crawler não pode garantir que a carga útil que ele busca é a que o usuário recebeu, mas vamos imaginar por um segundo que seja. A maioria dos scripts maliciosos são carregados como sub-requisições baseadas em gatilhos do usuário: cliques do usuário, rolagens, logins ou adição de algo ao carrinho.

Se um script malicioso for injetado devido a uma interação do usuário, o crawler não verá o script malicioso a menos que faça essa interação do usuário. Isso é praticamente impossível de fazer, pois cada página pode ter infinitas habilidades de interação. Exemplo: fazer apenas a busca ao script malicioso se uma série de botões for pressionada 5 vezes, rolada uma janela completa para baixo, o navegador não tiver ferramentas de desenvolvedor abertas... "Rastreamento sintético" afirma abordar isso, mas realmente não pode por razões técnicas óbvias.

Se você aplicar uma abordagem de análise de segurança estática a um problema dinâmico, você não aborda a preocupação de segurança.

Então todos os crawlers são inúteis?

Não. O conceito fundamental de um crawler é falho, mas se um fornecedor não espera ver a carga útil maliciosa em primeira mão através do crawler, mas é capaz de sinalizar o script pai através de outros métodos de detecção ativa fora do crawler, ele ainda pode abordar preocupações de segurança em um nível alto o suficiente (para alguns). Por exemplo: o crawler do cside usa a inteligência de script malicioso recebida através dos sites com proxy de outros clientes do cside. Como resultado, cargas úteis maliciosas são detectadas em outros sites e os objetos pai que injetaram esses scripts maliciosos são sinalizados, se o crawler recebeu a carga útil limpa, mas sabe que esse script está comprometido através de outros sites, isso levará a um alerta.

"Espere, mas vejo todos esses dados interessantes no painel deles?"

Isso é definitivamente um valor agregado. Crawlers podem dar a você uma compreensão de alguns dos comportamentos de alguns dos scripts em seu site, populando o painel, fornecendo insights interessantes. Mas qualquer script ruim saberá como não aparecer nesses painéis. Geralmente, as pessoas têm um viés por objetos brilhantes. Um painel brilhante com muitas informações interessantes nele leva as pessoas a pensar que as mesmas informações estarão disponíveis em um dia ruim. Isso, no entanto, não é o caso.

Por que considerar um crawler?

Segurança é tudo sobre camadas. Adicionar mais soluções para monitorar os mesmos problemas geralmente é uma coisa boa.

Eles são relativamente leves para implantar (geralmente) e fornecem um mapa básico de quais scripts estão presentes em seu site em um determinado momento. Para uma equipe de conformidade fazendo verificações periódicas ou auditorias que não são suscetíveis ao PCI DSS, isso é útil.

Eles também fornecem visibilidade sobre mudanças estáticas. Digamos que se uma nova URL de script aparecer repentinamente ou uma existente desaparecer. Nesse aspecto, é um passo acima do CSP, que não fornece nenhuma visibilidade de carga útil. Leia sobre as limitações dos CSPs aqui. Um crawler pode ajudá-lo a manter o inventário de scripts (parte de 6.4.3) e visualizar cabeçalhos de segurança quando rastreia (PCI 11.6.1), mas não pode impedir que scripts não autorizados sejam carregados. Você ainda precisaria pelo menos adicionar CSP ou um agente. Então, compre um crawler apenas se ele também fornecer um endpoint CSP ou um agente.

Um crawler sozinho não pode fornecer conformidade com o PCI DSS.

Founder & CEO Simon Wijckmans

Founder and CEO of cside. Previously a product manager on Cloudflare Page Shield (now Cloudflare Client-Side Security). Co-chair of the W3C Anti-Fraud Community Group and a Forbes 30 Under 30 honoree. Building accessible security against client-side attacks — web security is not an enterprise-only problem.

Don't just take our word for it, ask AI

FAQ

Frequently Asked Questions

Crawlers veem apenas o que o navegador vê em uma visita sintética. Eles perdem scripts carregados condicionalmente por horário, região, user agent ou sessão — exatamente o tipo de payload que atacantes usam para se esconder.

Inventário e autorização explícita de cada script na página de pagamento, mais monitoramento contínuo de cabeçalhos HTTP e do conteúdo dos scripts contra mudanças não autorizadas. Ambas precisam de visibilidade em sessões reais, não de rastreios periódicos.

Monitore e Proteja Seus Scripts de Terceiros

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Agende uma demonstração

Comece gratuitamente

Comece grátis, ou experimente o Business com um teste de 14 dias.

Interface do painel cside mostrando monitoramento de scripts e análises de segurança

Detecção de partilha de conta: como fechar a lacuna de execução que os limites de sessões simultâneas não cobrem

Os limites de sessões simultâneas sinalizam o caso óbvio.

Como Bloquear o Applebot-Extended no Seu Site

O Applebot-Extended é o crawler de treino de IA da Apple que alimenta o Apple Intelligence. Saiba como difere do Applebot e como recusar via robots.txt.

Capa escura do blog da cside com uma onda de pixels azuis e uma lista sobre monitoramento de scripts de terceiros em domínios de cassino

Como monitorar scripts de terceiros em 100 ou mais domínios de cassino

Guia prático para monitorar scripts de terceiros em 100+ domínios de cassino: expansão de scripts, alertas entre domínios e escalabilidade cside.

Riscos de segurança da IA agêntica para sites: privacidade, conformidade e detecção

Navegadores de IA agêntica ignoram o consentimento de cookies, executam JavaScript real e criam lacunas de conformidade com o RGPD que a detecção de bots em nível CDN não consegue ver.

Ilustração de um sistema neural de detecção de bots em duas etapas que separa sessões de navegador humanas e de bots

Apanhar bots que não querem ser apanhados: por dentro de uma stack de deteção neural de duas fases

Como uma stack neural de duas fases apanha stealth browsers, scrapers com proxy residencial e agentes LLM que passam as verificações de fingerprint.

Como Bloquear o DeepSeekBot no Seu Website

O DeepSeekBot rastreia o seu site para uma empresa chinesa de IA. Saiba como bloqueá-lo com robots.txt, regras de IP e os reais riscos de soberania de dados que ele levanta.

Capa escura do blog da cside com uma onda de pixels azuis e uma lista sobre conformidade de scripts perante a Malta Gaming Authority

Conformidade com a Malta Gaming Authority e Segurança de Scripts Client-Side: O Que os Operadores Licenciados pela MGA Precisam de Cobrir

As regras da MGA exigem uma plataforma segura e auditável. O JavaScript de terceiros é uma lacuna de conformidade que poucos auditaram.

Capa escura do blog da cside com uma onda de pixels azuis e uma lista sobre ataques de scripts de terceiros em plataformas de iGaming

Ataques de script de terceiros em plataformas iGaming em 2026: a nova superfície de ataque que os operadores ignoram

JavaScript de terceiros é a principal superfície de ataque não monitorada no iGaming. Sete classes de ataque e por que as ferramentas as ignoram.

Capa escura do blog da cside com uma onda de pixels azuis e uma lista sobre pixels não autorizados em sites de jogos e responsabilidade pelo GDPR

GDPR e Jogo Online: Por Que Razão os Pixels Não Autorizados Criam um Problema de Responsabilidade Dupla

Pixels não autorizados em sites de jogo criam responsabilidade GDPR e suspensão de contas de anúncios ao mesmo tempo, mesmo sem instalação.

Conformidade HIPAA com tecnologias de rastreamento web: o guia para organizações de saúde

O OCR do HHS determinou que pixels de rastreamento e scripts de terceiros em sites de saúde podem expor PHI. O que as entidades cobertas precisam fazer para estar em conformidade.