DeepSeek V3.2-Exp: Atención dispersa y precio de la API
DeepSeek ha publicado con V3.2-Exp un modelo intermedio experimental basado en la arquitectura V3.1. La introducción de DeepSeek Sparse Attention (DSA) tiene como objetivo reducir el gasto computacional, especialmente en contextos largos, sin afectar significativamente la calidad de la salida. Junto con ello, DeepSeek anunció una reducción significativa de los precios de la API. Este paso se interpreta como una preparación para la próxima generación de modelos y como una respuesta a la presión competitiva en el mercado de IA.
DeepSeek V3.2-Exp Visión general
DeepSeek V3.2-Exp es un modelo intermedio experimental que se basa en DeepSeek V3.1 (Terminus). La novedad central es la DeepSeek Atención dispersa (DSA). Esta variante de atención eficiente reduce el gasto computacional al no considerar todos los tokens anteriores simultáneamente, sino al seleccionar deliberadamente un subconjunto más pequeño. Esto reduce la memoria y la demanda de cálculo y facilita el procesamiento de entradas largas, como en la Documentación de vLLM. según el fabricante, el rendimiento en benchmarks se mantiene aproximadamente al nivel de V3.1-Terminus.
Los archivos del modelo y la descripción técnica están disponibles públicamente.. Una Tarjeta de modelo en Hugging Face así como un Informe técnico están disponibles.. DeepSeek ha publicado hoy V3.2-Exp como un paso intermedio hacia la próxima generación y, al mismo tiempo, ha anunciado una notable reducción de los precios de la API de 50%+, como Reuters informa Los documentos oficiales de la API mencionan „50%+“ como innovación clave, señalan la paridad con V3.1-Terminus en benchmarks y confirman la reducción de precios., V3.1-Terminus permanece accesible temporalmente para facilitar comparaciones. destaca la competitividad del modelo.. Arquitectura de la Atención Dispersa Nativa, que permite la eficiencia y el rendimiento de DeepSeek V3.2-Exp. Arquitectura de la Atención Dispersa Nativa, que permite la eficiencia y el rendimiento de DeepSeek V3.2-Exp. DSA Antecedentes y motivación V3.1-Terminus Este paso es parte de una estrategia a largo plazo..

Quelle: deepseekv3.org
Ya en febrero, DeepSeek redujo los precios fuera de pico hasta un 75% entre 16:30 y 00:30 GMT, lo que favorece especialmente las horas laborales europeas, como
Reuters informó
Además, DeepSeek anunció en febrero la Atención Dispersa Nativa como algoritmo y reafirmó la divulgación del código, lo que sugiere que DSA no es ad hoc, sino parte de una estrategia de eficiencia a largo plazo, como. Reuters señaló Los medios chinos sitúan V3.2-Exp como un paso intermedio experimental en un ritmo de lanzamientos rápido (V3.1 en agosto, actualización V3.1 en septiembre), como la. SCMP informó DeepSeek im Februar „Native Sparse Attention“ Los motivos para este paso intermedio son variados. und die Offenlegung von Code bekräftigt, was darauf hindeutet, dass DSA nicht ad hoc, sondern Teil einer langfristigen Effizienzstrategie ist, wie Primero: presión de costos y eficiencia. La atención eficiente reduce los costos de inferencia en contextos largos, tanto para el proveedor como para los usuarios. En relación con la reducción de precios de la API, esto afina la propuesta de valor de DeepSeek en términos de precio/rendimiento.. Segundo: aceleración de ciclos. Lanzamientos intermedios frecuentes mantienen la atención alta y permiten probar ideas arquitectónicas —aquí DSA— en la práctica, antes de introducir modelos de «Next-Gen». V3.2-Exp Tercero: dinamismo de mercado y plataformas. Señales de bajo costo/alto rendimiento de DeepSeek ya han provocado respuestas de mercado notables en 2025; los competidores tuvieron que replantear estrategias y precios, como (V3.1 im August, V3.1-Update im September), wie die The Guardian informó.
El video esboza la idea detrás de la Atención Dispersa Nativa como contexto de lo que DeepSeek ahora prueba de forma productiva con DSA.. Análisis y evaluación. Se demuestra el lanzamiento de hoy de V3.2-Exp como un modelo intermedio experimental y la introducción de DeepSeek Atención Dispersa. También se confirman la reducción oficial de precios de 50%+ y el acceso continuo a V3.1-Terminus para comparaciones. Modelos, artefactos y benchmarks están disponibles públicamente; la Tarjeta de modelo y el Informe técnico señalan paridad con V3.1-Terminus en benchmarks seleccionados. Arquitectura de la Atención Dispersa Nativa, que permite la eficiencia y el rendimiento de DeepSeek V3.2-Exp.. Arquitectura de la Atención Dispersa Nativa, que permite la eficiencia y el rendimiento de DeepSeek V3.2-Exp.. No está claro cómo DSA se comporta bajo carga de producción en cadenas de herramientas variadas (RAG, Agents, Tool Use) en comparación con V3.1-Terminus; las pruebas comunitarias iniciales son anecdóticas. Tampoco está claro cuán duradera es la reducción de precios y si se aplica de igual manera en todas las regiones/horas; las mecánicas Off-Peak sugieren modelos de precios diferenciados. La afirmación 'La próxima generación ya está aquí' es falsa/difícil de creer, ya que V3.2-Exp se describe expresamente como una etapa intermedia, no como un lanzamiento 'Next-Gen'.. Los competidores evalúan la influencia de DeepSeek de manera diversa: Anthropic habló de
Quelle: YouTube
casi ningún impacto
en su propia estrategia y destaca asociaciones a largo plazo en lugar de simples transacciones API, como
Business Insider informó. El CEO de OpenAI, Sam Altman, calificó la competencia de 'estimulante' y anunció lanzamientos más rápidos de 'modelos mejores', como Business Insider destacó V3.1-Terminus En los mercados financieros, a comienzos de 2025 hubo respuestas visibles a las iniciativas de DeepSeek, lo que cambió la percepción del paradigma precio-rendimiento en la IA.. Impactos y recomendaciones Para desarrolladores, esto significa que los contextos más largos se vuelven más rentables. Se recomienda probar V3.2-Exp frente a pipelines actuales (p. ej., RAG, Agents, Code-Assist) y prestar atención a la latencia, la estabilidad y los costos de tokens. DeepSeek ofrece una ruta de comparación con V3.1-Terminus.; Para las empresas, la competencia de precios aumenta el poder de negociación. Es recomendable revisar modelos de contrato (On-/Off-Peak), requisitos de datos y cumplimiento y planificar la diversificación de proveedores.. Fijación de precios de la API de DeepSeek-V3, que destaca la eficiencia de costos para tokens de entrada y salida. Fijación de precios de la API de DeepSeek-V3, que destaca la eficiencia de costos para tokens de entrada y salida.; Para el ecosistema: si DSA cumple lo prometido, podría surgir una ola de métodos de atención eficientes que se vayan a los caminos de inferencia principales (p. ej.

Quelle: deepnewz.com
Recetas de vLLM/Guías de implementación
). Quedan preguntas abiertas: ¿Qué tan robusta es DSA a través de dominios (Código, Uso de herramientas, Multilingüe, Recuperación)? Aquí ayudan benchmarks abiertos y reproducibles y pruebas independientes a largo plazo. ¿Qué tan sostenibles son las reducciones de precios a través de regiones y husos horarios? Matrices de precios transparentes y curvas de uso reales serían útiles. ¿Qué papel juegan nuevas informaciones de entrenamiento e infraestructura (p. ej., costos, hardware) para futuras generaciones, y cómo se verificarán? Conclusión: DeepSeek V3.2-Exp no es un “gran batacazo”, sino una prueba razonable. DSA promete menos gasto de cómputo en contextos largos, y el proveedor lo respalda con reducciones de precios y disponibilidad abierta. Para desarrolladores y empresas, esto significa comparar de forma pragmática, medir cargas de trabajo reales y renegociar el lado de costos, con miras a la estabilidad, cumplimiento y seguridad futura.;
„fast keinem Einfluss“ und betont langfristige Partnerschaften statt reiner API-Transaktionen, wie . Sam Altman .

Quelle: deepseekv3.org
. ; .
Quelle: YouTube