DeepSeek V3.2-Exp: Atenção Esparsa e Preço da API
DeepSeek lançou com o V3.2-Exp um modelo intermediário experimental, baseado na arquitetura V3.1. A introdução da Atenção Esparsa DeepSeek (DSA) visa reduzir o custo computacional, principalmente em contextos longos, sem prejuízo significativo da qualidade da saída. Em complemento, a DeepSeek anunciou uma redução expressiva dos preços da API. Este passo é interpretado como preparação para a próxima geração de modelos e como resposta à pressão competitiva no mercado de IA.
DeepSeek V3.2-Exp Visão Geral
O DeepSeek V3.2-Exp é um modelo intermediário experimental que se baseia no DeepSeek V3.1 ("Terminus"). A inovação central é a Atenção Esparsa DeepSeek (DSA). Esta variante de Atenção Esparsa reduz o custo computacional ao não observar mais todos os tokens anteriores simultaneamente, mas sim um subconjunto menor e cuidadosamente selecionado. Isso reduz a necessidade de memória e processamento e facilita o processamento de entradas longas, como na documentação do vLLM. explicando. Segundo o fabricante, o desempenho nos benchmarks permanece aproximadamente no nível do V3.1-Terminus.
Os arquivos de modelo e a descrição técnica estão publicamente disponíveis.. Uma Model Card no Hugging Face bem como um Relatório técnico estão disponíveis.. DeepSeek lançou hoje o V3.2-Exp como um 'passo intermediário' para a próxima geração e, ao mesmo tempo, anunciou uma redução de preços da API em '50%+' , como Reuters informou os documentos oficiais da API citam „50%+“ como inovação central, indicam paridade com o V3.1-Terminus nos benchmarks e confirmam a redução de preços., O V3.1-Terminus permanece acessível temporariamente para facilitar comparações. isso destaca a competitividade do modelo.. Arquitetura da Atenção Esparsa Nativa, que permite a eficiência e o desempenho do DeepSeek V3.2-Exp. Arquitetura da Atenção Esparsa Nativa, que permite a eficiência e o desempenho do DeepSeek V3.2-Exp. DSA Contextos e Motivação V3.1-Terminus Este passo faz parte de uma estratégia de longo prazo..

Quelle: deepseekv3.org
Já em fevereiro, a DeepSeek reduziu os preços fora de pico em até 75% entre 16:30–00:30 GMT, o que atende especialmente aos horários de trabalho europeus, como
Reuters informou
Além disso, em fevereiro a DeepSeek anunciou o algoritmo 'Atenção Esparsa Nativa' e reiterou a divulgação do código, o que sugere que a DSA não é ad hoc, mas parte de uma estratégia de eficiência de longo prazo, como. Reuters constatou Meios de comunicação chineses enquadram o V3.2-Exp como um passo intermediário em um ritmo rápido de lançamentos (V3.1 em agosto, atualização V3.1 em setembro), como a. SCMP informou DeepSeek im Februar „Native Sparse Attention“ As motivações para este passo intermediário são várias. und die Offenlegung von Code bekräftigt, was darauf hindeutet, dass DSA nicht ad hoc, sondern Teil einer langfristigen Effizienzstrategie ist, wie Primeiro: pressão de custos e eficiência. Atenção parcimoniosa reduz os custos de inferência em contextos longos, tanto para o fornecedor quanto para os usuários. Em conjunto com a redução dos preços da API, isso reforça a relação custo-desempenho da DeepSeek.. Segundo: aceleração de ritmo. Lançamentos intermediários frequentes mantêm a atenção alta e permitem testar ideias arquitetônicas — aqui DSA — na prática, antes de modelos 'Next-Gen' serem introduzidos. V3.2-Exp Terceiro: dinâmicas de mercado e plataforma. Sinais de baixo custo/alta performance da DeepSeek já provocaram reações de mercado em 2025; concorrentes tiveram que rever estratégias e preços, como (V3.1 im August, V3.1-Update im September), wie die The Guardian informou.
O vídeo esboça a ideia por trás da 'Atenção Esparsa Nativa' como contexto para o que a DeepSeek está agora testando de forma prática com DSA.. Análise e Avaliação. É comprovado o lançamento de hoje do V3.2-Exp como modelo intermediário experimental e a introdução da Atenção Esparsa DeepSeek. A redução oficial de preços de 50%+ e o acesso contínuo ao V3.1-Terminus para comparações também estão confirmados. Modelos, artefatos e benchmarks estão publicamente acessíveis; Model Card e Relatório técnico indicam paridade com o V3.1-Terminus em benchmarks selecionados. Arquitetura da Atenção Esparsa Nativa, que permite a eficiência e o desempenho do DeepSeek V3.2-Exp.. Arquitetura da Atenção Esparsa Nativa, que permite a eficiência e o desempenho do DeepSeek V3.2-Exp.. Não está claro como a DSA se comporta sob carga de produção em várias cadeias de ferramentas (RAG, Agents, Tool Use) em comparação com o V3.1-Terminus; os primeiros testes da comunidade são anedóticos. Também não está claro o quão estável é a redução de preços a longo prazo e se ele se aplica a todas as regiões/fusos horários; mecanismos Off-Peak sugerem modelos de preços diferenciados. A afirmação 'a próxima geração já chegou' é falsa/enganosa, pois o V3.2-Exp é explicitamente descrito como uma etapa intermediária, não como um lançamento 'Next-Gen'.. Concorrentes avaliam o impacto da DeepSeek de maneiras diferentes: a Anthropic mencionou
Quelle: YouTube
quase nenhum impacto
em sua própria estratégia e enfatiza parcerias de longo prazo em vez de transações puramente por API, como
Business Insider informou. O CEO da OpenAI, Sam Altman, descreveu a concorrência como 'estimulante' e anunciou lançamentos mais rápidos de 'modelos melhores', como Business Insider observou V3.1-Terminus Nos mercados financeiros, no início de 2025, houve reações observáveis às iniciativas da DeepSeek, o que mudou a percepção do paradigma de custo-benefício na IA.. Impactos e Recomendações Para desenvolvedores, contextos mais longos tornam-se mais práticos em termos de custo. Recomenda-se testar o V3.2-Exp com pipelines atuais (por exemplo, RAG, Agents, Code-Assist) e atentar para latência, estabilidade e custos por token. A DeepSeek oferece um caminho de comparação com o V3.1-Terminus.; Para as empresas, a competição de preços aumenta o poder de negociação. Recomenda-se revisar modelos contratuais (horários de pico e fora de pico), requisitos de dados e conformidade e planejar a diversificação de fornecedores.. Tarifa da API DeepSeek-V3, que destaca a eficiência de custo para tokens de entrada e saída. Tarifa da API DeepSeek-V3, que destaca a eficiência de custo para tokens de entrada e saída.; Para o ecossistema: se a DSA cumprir o prometido, pode surgir uma onda de métodos de Atenção Esparsa na inferência mainstream (p. ex.

Quelle: deepnewz.com
Receitas do vLLM/Guias de Implantação
). Perguntas em aberto permanecem: quão robusta é a DSA em domínios (Código, Uso de Ferramentas, Multilíngue, Recuperação)? Aqui ajudam benchmarks abertos, reprodutíveis e testes independentes de longo prazo. Quão sustentáveis são as reduções de preços em regiões e fusos horários? Matrizes de preços transparentes e curvas de uso real seriam úteis. Que papel desempenham novas informações de treinamento e infraestrutura (por exemplo, custos, hardware) para futuras gerações – e como serão verificadas? Conclusão: DeepSeek V3.2-Exp não é um 'grande golpe', mas sim um ensaio sensato. A DSA promete menos custo computacional para contextos longos, e o fornecedor sustenta isso com reduções de preços e disponibilização aberta. Para desenvolvedores e empresas, isso significa comparar de forma pragmática, medir cargas de trabalho reais e renegociar a parte de custos – com foco em estabilidade, conformidade e segurança para o futuro.;
„fast keinem Einfluss“ und betont langfristige Partnerschaften statt reiner API-Transaktionen, wie . Sam Altman .

Quelle: deepseekv3.org
. ; .
Quelle: YouTube