DeepSeek apresenta modelo experimental V3.2-exp

Na última segunda-feira, a DeepSeek revelou seu novo modelo de inteligência artificial, o V3.2-exp, com uma proposta ousada: reduzir drasticamente os custos de inferência em operações de longo contexto. O anúncio foi feito no Hugging Face, acompanhado de um artigo técnico publicado no GitHub.

Como funciona a novidade

O grande diferencial do V3.2-exp é a tecnologia chamada DeepSeek Sparse Attention. Esse sistema funciona em duas etapas:

  • Um “indexador de relâmpagos” prioriza os trechos mais relevantes dentro da janela de contexto.
  • Em seguida, um “seletor de tokens de granularidade fina” escolhe os tokens mais importantes desses trechos para serem processados.

Esse mecanismo permite que o modelo lide com textos longos consumindo muito menos recursos de servidor. Em testes preliminares, a DeepSeek mostrou que o custo de uma chamada de API poderia cair pela metade em cenários de contexto extenso. A expectativa é que a comunidade valide esses resultados rapidamente, já que o modelo é aberto e gratuito no Hugging Face.

Por que isso importa

Custos de inferência — ou seja, os gastos para rodar modelos de IA já treinados — são hoje um dos maiores desafios do setor. A DeepSeek busca otimizar a arquitetura de transformadores para que rodem de forma mais eficiente, algo que pode beneficiar desde startups até grandes provedores de serviços em nuvem.

DeepSeek e o cenário global

A empresa chinesa já chamou atenção no início do ano com o R1, um modelo treinado por aprendizado por reforço a custos bem menores do que rivais americanos. Apesar do hype inicial, o R1 não gerou a revolução esperada. Agora, com o V3.2-exp, a DeepSeek tenta se reposicionar, não tanto pelo espetáculo, mas pelo pragmatismo: oferecer soluções reais para reduzir despesas em IA.

Embora a “atenção esparsa” provavelmente não crie o mesmo burburinho do R1, a estratégia pode servir de inspiração para empresas dos EUA — que ainda enfrentam o dilema de como manter a potência dos modelos sem estourar os custos de operação.