Perplexity é acusada de burlar bloqueios para acessar conteúdo protegido na web

A Perplexity, plataforma de busca com inteligência artificial, está no centro de uma polêmica. De acordo com uma denúncia da Cloudflare — uma das maiores provedoras de infraestrutura da internet — a empresa estaria acessando e extraindo dados de sites que não autorizam esse tipo de atividade.

A acusação foi publicada no início da semana e aponta que a Perplexity estaria ignorando intencionalmente as restrições de alguns sites para realizar web crawling (indexação automatizada de páginas) e web scraping (extração de conteúdo). A Cloudflare afirma que a empresa estaria, inclusive, escondendo sua identidade digital para contornar os bloqueios.

Comportamento considerado “furtivo”

Segundo o relatório, mesmo quando a Perplexity é bloqueada por um site, ela continuaria tentando acessar os dados ao alterar o seu identificador de rede. Em vez de utilizar seu próprio “bot”, a empresa estaria simulando acessos a partir de navegadores comuns, como o Google Chrome no macOS. Isso dificulta a detecção e violaria as configurações definidas pelos administradores dos sites.

A Cloudflare afirma ter identificado esse comportamento por meio de análise de tráfego em milhares de domínios e milhões de requisições diárias. “Usamos sinais de rede e aprendizado de máquina para reconhecer esse tipo de rastreamento disfarçado”, informou a empresa.

Uso de bots é comum — mas há limites

Ferramentas baseadas em inteligência artificial, como mecanismos de busca e assistentes virtuais, costumam usar técnicas de crawling e scraping para coletar dados na internet. O problema, segundo a Cloudflare, não está na prática em si, mas no uso de métodos para acessar conteúdo que os próprios sites tentam proteger ou restringir.

Em resposta às acusações, a Perplexity negou que tenha violado qualquer política. A empresa disse que os dados apresentados não comprovam acesso indevido a conteúdo protegido e que os bots identificados não pertencem à sua operação.

Histórico de controvérsias

Essa não é a primeira vez que a Perplexity é acusada de uso indevido de conteúdo. Em 2024, veículos como a Wired afirmaram que a ferramenta estava copiando artigos completos sem autorização, o que reacendeu discussões sobre os limites do uso de dados por sistemas de IA.

Além disso, a Cloudflare tem se posicionado ativamente contra o rastreamento não autorizado por parte de bots de inteligência artificial. Em julho, lançou ferramentas que permitem aos donos de sites bloquear esse tipo de atividade com mais facilidade.

O caso reacende o debate sobre ética e transparência na coleta de dados por plataformas de IA. Em um cenário onde essas tecnologias se tornam cada vez mais presentes no nosso dia a dia, a forma como elas interagem com o conteúdo da web precisa ser mais clara — e respeitar os limites definidos por quem cria e hospeda esse conteúdo.