A OpenAI anunciou nesta quarta-feira (29) dois novos modelos de inteligência artificial voltados para identificar e classificar riscos à segurança digital em plataformas online. Batizados de gpt-oss-safeguard-120b e gpt-oss-safeguard-20b, os modelos são versões aprimoradas da linha gpt-oss, lançada em agosto, e trazem diferentes tamanhos e níveis de capacidade — refletidos nos números em seus nomes.
Transparência e personalização com pesos abertos
Os novos modelos foram lançados sob o formato “peso aberto” (open weights), o que significa que seus parâmetros estão disponíveis publicamente, permitindo maior transparência e controle sobre como suas decisões são tomadas.
Diferente de projetos totalmente de código aberto, os modelos da OpenAI não permitem modificações diretas no código-fonte, mas oferecem às empresas liberdade para ajustá-los conforme suas próprias políticas de segurança e moderação.
Com isso, plataformas podem aplicar os modelos para diversas finalidades:
- Sites de avaliações podem detectar e filtrar comentários falsos;
 - Fóruns de jogos podem classificar conteúdos relacionados a trapaças ou discurso de ódio;
 - Empresas de tecnologia podem usá-los para aprimorar sistemas automáticos de detecção de abusos.
 
Colaboração com a comunidade de segurança
O desenvolvimento do projeto contou com a colaboração da ROOST (Robust Open Online Safety Tools), do Discord e do SafetyKit. Inicialmente, os modelos estão disponíveis em prévia de pesquisa, com a OpenAI buscando feedback da comunidade de segurança e pesquisadores independentes.
A ROOST também está criando uma comunidade colaborativa dedicada a promover o uso responsável da IA em espaços online.
Segundo Camille François, presidente da ROOST:
“À medida que a IA se torna mais poderosa, as ferramentas de segurança precisam evoluir na mesma velocidade — e devem ser acessíveis a todos.”
Contexto e acesso
O lançamento acontece em um momento delicado para a OpenAI, que enfrenta debates sobre ética, transparência e ritmo de crescimento. A empresa recentemente concluiu um processo de recapitalização, consolidando sua estrutura híbrida — uma organização sem fins lucrativos com participação majoritária em negócios comerciais.
Usuários elegíveis já podem baixar os pesos dos modelos diretamente na plataforma Hugging Face, marcando mais um passo da OpenAI em direção a um ecossistema de IA mais aberto, auditável e seguro.