Alguém já imaginou que um dia a tecnologia cresceria a ponto de um computador conseguir reconstruir a face de uma pessoa simplesmente a partir de ato de ouvir a voz, mesmo que a pessoa não conheça seu rosto? A sua imaginação não tenha ido tão longe, uma Inteligência Artificial desenvolvida pelo MIT acabou de realizar esse processo.
Desde 2019 os pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) estão trabalhando, no desenvolvimento de uma Inteligência Artificial que consegue converter fragmentos de áudio gravados de vozes de pessoas nos rostos daqueles que falam, os pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL).
Parece algo inconcebível, mas o CSAIL acaba de apresentar os últimos avanços dessa IA, chamada Speech2Face. Como você pode ver nas imagens, os resultados são mais do que impressionantes, embora a plataforma não consiga reconstruir um retrato 100% preciso:
O MIT disse que o modelo desenvolvido é treinado para capturar recursos visuais relacionados a idade, sexo, etc., que são comuns a muitas pessoas, e somente nos casos em que há evidências suficientes para conectar esses elementos com atributos de voz. Com isso, o modelo produzirá apenas rostos de aparência média, com características visuais que se correlacionam com a fala de entrada, mas não produzirá imagens de indivíduos específicos.
Como a IA realiza essa magia, é baseada em bases estatísticas e científicas documentadas, onde certas características de tonalidade, timbre, modulação e ritmo são reflexo de alguma característica física específica na constituição facial dos sujeitos.
Quanto mais longo for o fragmento de áudio analisado pela IA, mais completo será o retrato desenvolvido pela plataforma, isso devido aos últimos avanços do projeto.
A própria equipe do MIT CSAIL admite que a tecnologia nunca poderia ser completamente precisa, o que traz alívio para aqueles que estão preocupados com o cuidado de sua privacidade.