O Google ampliou os recursos do Gemini, sua plataforma de inteligência artificial generativa, permitindo que os usuários enviem vídeos diretamente para análise. A nova funcionalidade começou a ser disponibilizada na quinta-feira (19) para Android, iOS e web.
Antes, o Gemini aceitava apenas links do YouTube. Agora, é possível enviar gravações pessoais ou de qualquer outra fonte, além dos formatos já suportados como fotos e documentos.
Como funciona o envio de vídeos no Gemini
Tanto usuários gratuitos quanto assinantes podem usar o recurso. Após o upload, a IA é capaz de identificar elementos visuais, fazer descrições detalhadas e responder a perguntas relacionadas ao conteúdo do vídeo.
O processo é simples:
-
No app (Android ou iOS): toque no ícone de “+” dentro da conversa e selecione o vídeo da galeria;
-
Na versão web: clique em “+” no campo de texto e selecione o vídeo do seu computador ou do Google Drive;
-
Após o upload, o vídeo aparecerá na interface do chat, permitindo interações com a IA.
Nos testes realizados por sites especializados, o Gemini conseguiu identificar horários em gravações e descrever com precisão o que ocorria em cena.
Como a atualização está sendo liberada de forma gradual, alguns usuários podem não ter acesso imediato. Caso o sistema informe que o formato não é suportado, será necessário aguardar a liberação e manter o aplicativo atualizado. Vale destacar que o envio direto por câmera ainda não está disponível.
Avanços na linha Gemini 2.5
Junto à nova funcionalidade, o Google anunciou o lançamento das versões estáveis dos modelos Gemini 2.5 Pro e Gemini 2.5 Flash, antes restritas a testadores. O 2.5 Pro é voltado a tarefas mais exigentes, como o desenvolvimento de agentes de IA complexos, enquanto o 2.5 Flash é otimizado para desempenho superior em tarefas rápidas.
A empresa também apresentou uma prévia do Gemini 2.5 Flash-Lite, um modelo mais leve e econômico, projetado para uso em dispositivos com menos capacidade de processamento.
Com essas novidades, o Google reforça sua aposta em oferecer ferramentas mais versáteis e acessíveis dentro do ecossistema de IA generativa, ampliando as possibilidades de interação com conteúdo multimídia.