Skip to main content
Blog
Blog

Deteção de agentes IA e bots: distinguir humanos, bots bons e agentes maliciosos

Uma taxonomia de classificação e um modelo de imposição baseado na intenção para separar humanos, bots bons e agentes maliciosos, e depois decidir o que fazer com cada um.

Jul 11, 2026 7 min read
Deteção de agentes IA e bots: distinguir humanos, bots bons e agentes maliciosos

Tem três problemas com o mesmo disfarce. Um humano a ler a sua página de checkout, um crawler de pesquisa a indexá-la e um stealth browser a enumerar cartões roubados contra ela podem todos apresentar um user-agent de Chrome plausível e um IP residencial limpo. Trate-os como um único grupo e, ou bloqueia receita, ou deixa passar fraude.

A correção é uma taxonomia e uma decisão: classifique cada sessão numa classe conhecida, leia o que está a tentar fazer e mapeie isso exatamente para uma ação: permitir, monitorizar, desafiar, servir conteúdo para agentes ou bloquear. Este artigo é a estrutura de classificação e decisão. Para a mecânica dos sinais subjacentes, o guia para detetar tráfego de agentes IA cobre sinais de identidade, rede, navegador e comportamento; para escolher um fornecedor, consulte como escolher uma solução de deteção de agentes IA. Quando precisar de saber porque é que as defesas mais antigas falham este tráfego, a deteção de bots tradicional na era dos agentes IA explica a lacuna.

Uma taxonomia de cinco classes que mapeia para uma ação

"Bot bom vs bot mau" é demasiado grosseiro, porque o agente de compras de um consumidor é automatizado e bem-vindo, enquanto um crawler de pesquisa é automatizado e bem-vindo por uma razão completamente diferente. Divida o tráfego em cinco classes operacionais, cada uma ligada a uma ação predefinida:

ClasseExemplosIntençãoAção predefinida
HumanoVisitantes reais, clientes com sessão iniciadaNavegar, comprar, gerir a contaPermitir, monitorizar o risco
Bot bomGooglebot, GPTBot, ClaudeBot, PerplexityBot, bots de API de parceirosIndexar conteúdo, integração declaradaPermitir, limitar a taxa, verificar a identidade
Automatização neutraMonitores de disponibilidade, verificadores de links, fetchers de RSS/pré-visualizaçãoOperacional, baixo valor, baixo danoMonitorizar, limitar a taxa
Agente IA de consumoAgentes de compras e de pesquisa que atuam por uma pessoa realCompletar uma tarefa em nome de uma pessoaPermitir ou servir conteúdo para agentes
Agente maliciosoScrapers, testadores de cartões, bots de abuso de contas, stealth browsersExtrair valor ou cometer fraudeDesafiar ou bloquear

A classe não é fixa para uma sessão. Um agente de consumo a navegar por páginas de produto está na coluna de "permitir" até ao momento em que começa a submeter formulários de pagamento à velocidade de máquina, ponto em que a sua intenção, e a sua classe, mudaram.

A identidade diz-lhe quem; a intenção diz-lhe o que fazer

Os sinais de identidade respondem a "quem é que isto afirma ser": user-agent, nome de crawler declarado, fingerprint. São necessários e quase gratuitos de falsificar. Um GPTBot que se autodeclara pode ser verificado cruzando o IP do pedido com as gamas publicadas do crawler, o que apanha os impostores. Mas as classes perigosas nunca se declaram a si próprias.

Os sinais de intenção respondem a "o que está a fazer esta sessão". Vivem no comportamento e no runtime, e são muito mais caros de falsificar de forma convincente:

  • navigator.webdriver definido, ou suprimido de forma demasiado limpa, numa sessão que de resto parece Chrome vulgar.
  • Fugas de CDP / Runtime: artefactos do Chrome DevTools Protocol (propriedades cdc_, nós de acessibilidade removidos) que traem Playwright ou Puppeteer a controlar a página.
  • Deriva de fingerprint: contextos de WebGL, Canvas e Audio que não contam uma história coerente sobre um único dispositivo, ou que mutam ao longo de uma sessão.
  • Comportamento de proxy residencial: um IP "de consumidor" cujo fuso horário, idioma e histórico de ASN não se alinham, rodando entre pedidos.
  • Cadência de ações: uma rajada de submissões de cartões em poucos minutos é intenção, não identidade. Nenhuma string de user-agent lhe dirá isso; a sequência de ações sim.

Classifica-se com identidade e intenção em conjunto. Uma sessão que passa em todas as verificações de identidade mas falha no runtime e na cadência é exatamente o caso de agente malicioso que a ferramenta só de rede deixa passar.

Porque é que isto importa mais em 2026

A classe maliciosa ficou barata. A investigação de segurança web de 2026 da cside relata que as instalações de playwright-stealth aumentaram cerca de 10x ao longo de 2025, um indicador limpo da rapidez com que a automatização anti-deteção passou de nicho para ferramenta de ataque generalizada. Relatório de investigação da cside 2026

Ao mesmo tempo, as classes bem-vindas cresceram. Os crawlers de pesquisa com IA agora impulsionam descoberta real, e os agentes de compras de consumo completam compras reais. Por isso, as duas pontas da taxonomia expandiram-se ao mesmo tempo: mais automatização que quer permitir, e mais automatização construída especificamente para parecer sê-lo. É por isso que um detetor binário falha: não tem coluna para "automatizado e bem-vindo". Para a mecânica profunda de como a ponta maliciosa se esconde, consulte stealth browsers e navegadores anti-deteção, explicados. Os mesmos sinais apanham as campanhas de credential stuffing que atingem o login assim que um agente passa de navegação para o ataque a contas.

Mapeie cada classe para uma ação de imposição

Depois de uma sessão classificada, a imposição deve ser determinística. Cinco ações cobrem a taxonomia:

  1. Permitir: humanos e bots bons verificados nos seus caminhos esperados. Registe e siga em frente.
  2. Monitorizar: automatização neutra e qualquer sessão cuja classe ainda seja ambígua. Recolha sinais, não adicione atrito ainda.
  3. Desafiar / limitar a taxa: sessões com tendência para maliciosas. Abrande-as, suba o nível de verificação ou limite a taxa da ação específica (login, checkout) em vez de todo o site.
  4. Servir conteúdo para agentes: um agente de consumo conhecido num caminho onde prefere guiar em vez de bloquear. Dê-lhe uma vista feita propositadamente ou um passo de "contacte-nos" em vez de deixar fugir preços em bruto para uma sessão com forma de scraper.
  5. Bloquear: intenção maliciosa confirmada, como enumeração de cartões, credential stuffing e campanhas de abuso de contas.

Duas regras mantêm isto honesto. Limite as ações à ação, não ao visitante: desafie a submissão do checkout, não responda 403 à homepage. E tome a decisão por página: um stealth browser a ler um post do blog é um caso de monitorizar; a mesma sessão no seu cofre de cartões é um caso de bloquear. Para o manual sobre a ponta do bloqueio, consulte como bloquear agentes IA no seu site e, para a variante de fraude de pagamentos, como bloquear agentes IA de teste de cartões.

Onde a classificação tem de acontecer

Esta taxonomia só funciona se conseguir ler a intenção, e a intenção vive no navegador. Os crawlers de IA que nunca executam JavaScript nunca disparam a sua analítica, por isso são invisíveis ao GA4 e ao PostHog. Os agentes de consumo e maliciosos executam navegadores reais e parecem humanos para as mesmas ferramentas. Nenhuma das pontas é separável na camada de analítica, e a maior parte da classe maliciosa passa nas verificações da camada de rede por desenho: IP limpo, user-agent válido, forma de pedido plausível.

A cside observa o runtime do navegador em tempo real. Captura o dispositivo e o IP real, expõe os sinais de automatização e de fingerprint que revelam a intenção, sinaliza agentes IA e stealth browsers dentro da página e expõe esses sinais via API para que possa impulsionar a decisão de permitir / monitorizar / desafiar / servir / bloquear no seu próprio fluxo de trabalho. Essa é a camada onde um humano, um bot bom e um agente malicioso finalmente deixam de se parecer.

Mais leituras na cside

Simon Wijckmans
Founder & CEO

Founder and CEO of cside. Previously a product manager on Cloudflare Page Shield (now Cloudflare Client-Side Security). Co-chair of the W3C Anti-Fraud Community Group and a Forbes 30 Under 30 honoree. Building accessible security against client-side attacks — web security is not an enterprise-only problem.

FAQ

Frequently Asked Questions

Cinco classes operacionais cobrem a maior parte do tráfego: humanos, bots bons que deseja (crawlers de pesquisa e de IA, integrações de parceiros), automatização neutra que tolera (monitores de disponibilidade, verificadores de links), agentes IA de consumo que atuam por uma pessoa real (agentes de compras e de pesquisa) e agentes maliciosos (scrapers, testadores de cartões, bots de abuso de contas, stealth browsers). As classes importam porque cada uma merece uma ação de imposição diferente: juntá-las em 'bot ou não bot' deita fora a decisão que realmente precisa de tomar.

A identidade é quem uma sessão afirma ser: uma string de user-agent, um nome de crawler declarado, uma fingerprint. A intenção é o que a sessão está a tentar fazer agora mesmo: ler um artigo, bloquear inventário, enumerar cartões, criar contas. A identidade é barata de falsificar e estável ao longo de uma sessão; a intenção é revelada pelo comportamento e muda à medida que a sessão passa de navegação para uma tentativa de transação. A imposição deve basear-se na intenção, porque isso é o que um atacante não consegue falsificar de graça.

Porque os bots bons e os agentes IA de consumo já fazem parte do seu tráfego. O bloqueio indiscriminado remove os crawlers de pesquisa e de pesquisa com IA que impulsionam a descoberta, parte as integrações de parceiros e afasta os agentes de compras que completam compras reais para clientes reais. Também destrói a sua própria visibilidade: depois de responder 403 a tudo, deixa de aprender o que estava realmente a chegar ao seu site. O objetivo é uma política que permita as classes úteis e reserve o atrito para as prejudiciais.

Monitore e Proteja Seus Scripts de Terceiros

Gain full visibility and control over every script delivered to your users to enhance site security and performance.

Comece grátis, ou experimente o Business com um teste de 14 dias.

Interface do painel cside mostrando monitoramento de scripts e análises de segurança
Related Articles
Agende uma demonstração