Estudo revela que IAs podem herdar comportamentos perigosos de outras inteligências artificiais
Um novo estudo acende um alerta sobre os riscos do uso de dados gerados por outras IAs para treinar modelos de linguagem. Segundo a pesquisa publicada na plataforma arXiv, modelos treinados com esse tipo de conteúdo podem absorver — e até intensificar — traços comportamentais indesejados, mesmo que esses sinais estejam camuflados nos dados. O trabalho foi conduzido pelo grupo de pesquisa Truthful AI, em parceria com o programa Anthropic Fellows, e mostra que essa “herança” acontece de forma subliminar, ou seja, sem que os Continue→