O Google acaba de lançar o SynthID, uma nova ferramenta que promete identificar textos criados por modelos de IA, como os da linha Gemini. Desenvolvida pela divisão Google DeepMind, o SynthID marca conteúdo gerado por inteligência artificial com uma espécie de “marca d’água” invisível para humanos, mas detectável por máquinas.
Essas marcas digitais podem ser aplicadas a vários tipos de conteúdo — como textos, imagens, áudios e vídeos — e são embutidas de forma que não afetam a qualidade do material gerado. No caso dos textos, a ferramenta usa um padrão secreto de geração que pode ser reconhecido, mas sem garantir 100% de certeza. Em vez disso, ela indica uma probabilidade (de 0% a 100%) de que o conteúdo seja obra de IA.
Como funciona o SynthID?
Quando usado em textos, o SynthID se comporta como um processador de logits, introduzindo um padrão probabilístico sem interferir no fluxo da criação. A ferramenta consegue então identificar se um conteúdo contém a marca d’água, está sem a marca ou se há incertezas. O Google diz que a detecção pode ser ajustada, mas lembra que a ferramenta não é infalível.
Um ponto importante é que, em textos curtos ou muito reescritos (ou traduzidos), a marca d’água pode se perder, o que limita a precisão. Além disso, o SynthID não foi feito para impedir que o conteúdo seja usado para fins maliciosos, mas sim para dificultar esse tipo de abuso, especialmente em plataformas que publicam conteúdos gerados por IA.
Disponibilidade e limitações
O SynthID já está disponível no Hugging Face Transformers (versão 4.46.0 ou superior) e também tem uma aplicação de referência no GitHub. No entanto, vale lembrar que ele não é 100% confiável, então não é ideal para ser usado em análises acadêmicas ou jurídicas como prova definitiva de que um texto foi gerado por IA.
Interessado em saber mais? A documentação completa da ferramenta está no site oficial do Google.