DeepSeek V3.2-Exp: Разрежённое внимание и цена API
DeepSeek выпустил с V3.2-Exp экспериментальную промежуточную модель, основанную на архитектуре V3.1. Введение DeepSeek Sparse Attention (DSA) направлено на снижение вычислительных затрат, особенно при длинных контекстах, без значительного ухудшения качества вывода. Параллельно с этим DeepSeek объявил о заметном снижении цен на API. Этот шаг рассматривается как подготовка к следующему поколению моделей и ответ на конкурентное давление на рынке ИИ.
Обзор DeepSeek V3.2-Exp
DeepSeek V3.2-Exp — это экспериментальная промежуточная модель, основанная на DeepSeek V3.1 («Terminus»). Основное нововведение — это DeepSeek разрежённое внимание (DSA). Этот экономичный вариант внимания снижает вычислительную нагрузку тем, что больше не учитывает все ранние токены одновременно, а выбирает целенаправленно меньшую, ограниченную выборку. Это снижает потребление памяти и вычисления и упрощает обработку длинных входов, как в Документация vLLM. По словам производителя, производительность в бенчмарках примерно остается на уровне V3.1-Terminus.
Файлы моделей и техническое описание доступны общественности.. Одна Карта модели на Hugging Face а также Технический доклад доступны.. DeepSeek выпустил сегодня V3.2-Exp как промежуточный шаг к следующему поколению и одновременно объявил о заметном снижении цен на API на 50%+, как Reuters сообщает Официальные документы API называют „50%+“ как основную инновацию, указывают на паритет с V3.1-Terminus в бенчмарках и подтверждают снижение цен., V3.1-Terminus остается доступным временно для облегчения сравнения. Подчеркивает конкурентоспособность модели.. Архитектура Native Sparse Attention, которая обеспечивает эффективность и производительность DeepSeek V3.2-Exp. Архитектура Native Sparse Attention, которая обеспечивает эффективность и производительность DeepSeek V3.2-Exp. DSA Фон и мотивация V3.1-Terminus Этот шаг является частью долгосрочной стратегии..

Quelle: deepseekv3.org
Уже в феврале DeepSeek снизил цены вне пиков до 75% в диапазоне 16:30–00:30 GMT, что особенно соответствует европейскому рабочему времени, как
Reuters сообщил
Кроме того, в феврале DeepSeek объявил Native Sparse Attention как алгоритм и подтвердил раскрытие кода, что указывает на то, что DSA не является произвольной модификацией, а частью долгосрочной стратегии повышения эффективности, как. Reuters отметил Китайские СМИ относят V3.2-Exp как экспериментальный промежуточный шаг к быстрой схеме выпусков (V3.1 в августе, обновление V3.1 в сентябре), как пишет SCMP. SCMP сообщила DeepSeek im Februar „Native Sparse Attention“ Мотивы для этого промежуточного шага разнообразны. und die Offenlegung von Code bekräftigt, was darauf hindeutet, dass DSA nicht ad hoc, sondern Teil einer langfristigen Effizienzstrategie ist, wie Во-первых: давление по затратам и эффективности. Экономное внимание снижает затраты на инференс при длинных контекстах, как для поставщика, так и для пользователей. В сочетании с понижением цен на API это усиливает ценовую позицию DeepSeek.. Во-вторых: ускорение тактов. Частые промежуточные релизы поддерживают внимание и позволяют на практике протестировать архитектурные идеи — здесь DSA — прежде чем внедрять модели Next-Gen. V3.2-Exp В-третьих: рыночная и платформенная динамика. Низкозатратные/высокопроизводительные сигналы от DeepSeek уже вызвали ощутимые реакции на рынке в 2025 году; конкуренты были вынуждены переосмыслить стратегии и цены, как (V3.1 im August, V3.1-Update im September), wie die The Guardian сообщила.
Видео иллюстрирует идею, лежащую в основе Native Sparse Attention, как контекст того, что DeepSeek теперь тестирует с DSA в практических условиях.. Анализ и оценка. Подтверждено, что сегодняшний выпуск V3.2-Exp в качестве экспериментальной промежуточной модели и внедрение DeepSeek Sparse Attention. Официальное снижение цены на 50%+ и сохранение доступа к V3.1-Terminus для сравнений также подтверждены. Модели, артефакты и бенчмарки доступны. Карта модели и технический доклад указывают на паритет с V3.1-Terminus на выбранных бенчмарках. Архитектура Native Sparse Attention, которая обеспечивает эффективность и производительность DeepSeek V3.2-Exp.. Архитектура Native Sparse Attention, которая обеспечивает эффективность и производительность DeepSeek V3.2-Exp.. Неясно, как DSA будет работать под производственной нагрузкой в различных рабочих цепочках (RAG, агенты, использование инструментов) по сравнению с V3.1-Terminus; первые тесты сообщества носит анекдотический характер. Также неясно, насколько долговременна ценовая скидка и будет ли она одинаково влиять на все регионы/часы; механизмы Off-Peak предполагают дифференцированные ценовые модели. Утверждение Next-Gen уже здесь неверно, поскольку V3.2-Exp явно обозначен как промежуточная ступень, а не выпуск Next-Gen.. Конкуренты оценивают влияние DeepSeek по-разному: Anthropic говорил о
Quelle: YouTube
почти полном отсутствии влияния
на свою стратегию и подчеркивает долгосрочные партнерства вместо чисто API-транзакций, как
Business Insider сообщил. Глава OpenAI Сэм Альтман назвал конкуренцию оживляющей и пообещал более быстрые релизы лучших моделей, как Business Insider отметил V3.1-Terminus На финансовых рынках в начале 2025 года наблюдались заметные реакции на продвижение DeepSeek, что изменило восприятие парадигмы цена‑качество в ИИ.. Влияние и рекомендации Для разработчиков это означает, что более длинные контексты становятся практичнее с меньшими затратами. Рекомендуется тестировать V3.2-Exp против текущих пайплайнов (например, RAG, Agents, Code-Assist) и обращать внимание на задержку, стабильность и стоимость токенов. DeepSeek предоставляет путь для сравнения с V3.1-Terminus.; Для компаний ценовая конкуренция повышает переговорную мощь. Рекомендуется проверить модели контрактов (On-/Off-Peak), требования к данным и требованиям по соблюдению, а также планировать диверсификацию поставщиков.. Ценообразование DeepSeek-V3 API, которое подчеркивает экономию для входных и выходных токенов. Ценообразование DeepSeek-V3 API, которое подчеркивает экономию для входных и выходных токенов.; Для экосистемы применимо: если DSA держит обещания, волна экономичных методов внимания может распространиться в мейнстримные инференс-пути (например,

Quelle: deepnewz.com
vLLM-рецепты/руководства по развёртыванию
Открытые вопросы остаются: насколько DSA устойчив в разных доменах (код, использование инструментов, мультиязычие, поиск)? Здесь помогут открытые воспроизводимые бенчмарки и независимые долгосрочные тесты. Насколько устойчивы снижения цен по регионам и времени суток? Прозрачные матрицы ценообразования и реальные кривые использования были бы полезны. Какую роль будут играть новые данные о тренировке и инфраструктуре (например, расходы, оборудование) для будущих поколений — и как их будут проверять? Итог: DeepSeek V3.2-Exp — не большой прорыв, а разумно проведённый пробный запуск. DSA обещает меньшие вычислительные затраты при длинных контекстах, продавец поддерживает это снижением цен и открытой доступностью. Для разработчиков и компаний это означает прагматично сравнивать, измерять реальные рабочие нагрузки и пересматривать затраты — с акцентом на стабильность, соблюдение требований и безопасность на будущее.;
„fast keinem Einfluss“ und betont langfristige Partnerschaften statt reiner API-Transaktionen, wie . Sam Altman .

Quelle: deepseekv3.org
. ; .
Quelle: YouTube