DeepSeek V3.2-Exp: الانتباه المتناثر وسعر API
أصدرت DeepSeek مع V3.2-Exp نموذجًا وسيطًا تجريبيًا يعتمد على بنية V3.1. يهدف إدخال DeepSeek Sparse Attention (DSA) إلى تقليل استهلاك الحوسبة، خاصةً في السياقات الطويلة، دون التأثير بجودة الإخراج بشكل كبير. وبالتزامن مع ذلك، أعلنت DeepSeek عن انخفاض واضح في أسعار واجهة برمجة التطبيقات (API). وتُفَسَّر هذه الخطوة كتحضير للإصدار التالي من النموذج وكتعبير عن الضغط التنافسي في سوق الذكاء الاصطناعي.
نظرة عامة على DeepSeek V3.2-Exp
DeepSeek V3.2-Exp هو نموذج وسيط تجريبي يعتمد على DeepSeek V3.1 („Terminus“). التغيير الأساسي هو الانتباه المتناثر (DSA) من DeepSeek. هذا النمط من الانتباه المتناثر يقلل من استهلاك الحوسبة من خلال عدم النظر في جميع الرموز السابقة في آن واحد، بل اختيار جزء أصغر ومحدد. هذا يخفض من مشتركات الذاكرة والحساب، ويسهل معالجة الإدخالات الطويلة، كما في وثائق vLLM توثيق vLLM. كما يشرح. وفقًا للمُصنِع، يبقى الأداء في القياسات يعادل تقريبًا مستوى V3.1-Terminus.
ملفات النموذج والوصف التقني متاحان علنًا.. إحدى بطاقة النموذج على Hugging Face وكذلك واحد تقرير تقني متاحان.. أصدرت DeepSeek اليوم V3.2-Exp كـ «خطوة وسطى» نحو الجيل التالي، وفي الوقت نفسه أعلنت عن تخفيض واضح في أسعار API بنسبة «50%+» كما ذكرت رويترز المستندات الرسمية لـ API تذكر „50%+“ كأبرز ابتكار، تشير إلى التكافؤ مع V3.1-Terminus في القياسات وتؤكد التخفيض في الأسعار., يظل V3.1-Terminus متاحًا مؤقتًا لتسهيل المقارنات. ويدل ذلك على تنافسية النموذج.. هيكلية الانتباه المتناثر الأصلية، التي تتيح كفاءة وأداء DeepSeek V3.2-Exp. هيكلية الانتباه المتناثر الأصلية، التي تتيح كفاءة وأداء DeepSeek V3.2-Exp. DSA الخلفيات والدوافع V3.1-Terminus هذه الخطوة جزء من استراتيجية طويلة الأجل..

Quelle: deepseekv3.org
في فبراير، خفضت DeepSeek أسعار خارج الذروة بنسب تصل إلى 75% بين 16:30–00:30 بتوقيت GMT، وهو ما يتوافق بشكل خاص مع ساعات العمل الأوروبية، كما
ذكرت رويترز
علاوة على ذلك، أعلنت DeepSeek في فبراير عن «الانتباه المتناثر الأصلي» كخوارزمية، وأكدت إفصاحها عن الشفرة، ما يشير إلى أن DSA ليست إجراءً عشوائيًا، بل جزء من استراتيجية كفائة طويلة الأجل، كما. ذكرت رويترز وسائل الإعلام الصينية تصنف V3.2-Exp كخطوة وسيطة تجريبية ضمن وتيرة إصدار سريعة (V3.1 في أغسطس، تحديث V3.1 في سبتمبر)، كما أن. ذكرت SCMP DeepSeek im Februar „Native Sparse Attention“ دوافع هذه الخطوة الوسيطة متعددة. und die Offenlegung von Code bekräftigt, was darauf hindeutet, dass DSA nicht ad hoc, sondern Teil einer langfristigen Effizienzstrategie ist, wie أولاً: ضغوط التكلفة والكفاءة. الانتباه المقتصد يقلل تكاليف الاستدلال في السياقات الطويلة، لكل من المزود والمستخدم. بالتزامن مع تخفيض أسعار API، يعزز ذلك موضع DeepSeek من حيث السعر/الأداء.. ثانياً: تسريع الإيقاع. الإصدارات الوسيطة المتكررة تحافظ على الانتباه وتتيح اختبار أفكار بنيوية — هنا DSA — عملياً قبل إدخال نماذج الجيل القادم. V3.2-Exp ثالثاً: ديناميكيات السوق والمنصة. إشارات منخفضة التكلفة وعالية الأداء من DeepSeek أدت في 2025 إلى ردود فعل سوقية ملموسة؛ اضطر المنافسون إلى إعادة التفكير في الاستراتيجيات والأسعار، كما (V3.1 im August, V3.1-Update im September), wie die ذكرت صحيفة The Guardian.
يلخص الفيديو فكرة وراء «الانتباه المتناثر الأصلي» كإطار للسياق لما تختبره DeepSeek الآن بشكل عملي مع DSA.. التحليل والتقييم. يثبت الإصدار اليوم من V3.2-Exp كنموذج وسيط تجريبي، وإدخال DeepSeek Sparse Attention. كما تم تأكيد خفض الأسعار الرسمي بنسبة «50%+» والوصول المستمر إلى V3.1-Terminus للمقارنات. النماذج والقطع والقياسات متاحة علنًا؛ وتُشير Model Card و Tech-Report إلى التماثل مع V3.1-Terminus على مقاييس مختارة. هيكلية الانتباه المتناثر الأصلية، التي تتيح كفاءة وأداء DeepSeek V3.2-Exp.. هيكلية الانتباه المتناثر الأصلية، التي تتيح كفاءة وأداء DeepSeek V3.2-Exp.. غير واضح كيف ستتصرف DSA تحت أحمال الإنتاج في سلاسل الأدوات المتنوعة (RAG، الوكلاء، استخدام الأدوات) مقارنةً بـ V3.1-Terminus؛ الاختبارات المجتمعية الأولية تقاريرها قصصية. كما أن مدى دوام خفض الأسعار وهل يؤثر بالقدر نفسه على جميع المناطق/أنظمة التوقيت غير واضح؛ تشير آليات Off-Peak إلى نماذج تسعير مختلفة. الادعاء بأن «الجيل القادم موجود» غير صحيح/مضلل، لأن V3.2-Exp موصوف صراحة كمرحلة وسيطة، وليست إصدار «Next-Gen».. يقيّم المنافسون تأثير DeepSeek بشكل مختلف: أشارت Anthropic إلى
Quelle: YouTube
تقريبًا إلى عدم وجود تأثير
على استراتيجتها الخاصة وتؤكد على الشراكات الطويلة الأجل بدلاً من معاملات API فقط، كما
أفادت Business Insider. وصف مؤسس OpenAI سام ألتمان المنافسة بأنها «منشطة» وأعلن عن إصدارات أسرع «نماذج أفضل»، كما أشارت Business Insider V3.1-Terminus في بداية 2025 كانت هناك ردود فعل في الأسواق تجاه مساعي DeepSeek، مما غيّر إدراك نموذج السعر-الأداء في الذكاء الاصطناعي.. التأثيرات والتوصيات بالنسبة للمطورين، يعني ذلك أن السياقات الأطول تصبح بتكلفة أقل وأكثر قابلية للتطبيق. من المستحب اختبار V3.2-Exp مقابل خطوط الأنابيب الحالية (مثلاً RAG، الوكلاء، Code-Assist) ومراعاة الكمون، الاستقرار وتكاليف الرموز. تقدم DeepSeek مسار مقارنة إلى V3.1-Terminus.; أما للشركات، فيزيد التنافس السعري من قوة التفاوض. من الحكمة فحص نماذج العقود (On-/Off‑Peak)، ومتطلبات البيانات والامتثال، وتخطيط تنويع المزودين.. سياسة تسعير واجهة DeepSeek‑V3 (API)، التي تبرز الكفاءة في التكلفة لرموز الإدخال والإخراج. سياسة تسعير واجهة DeepSeek‑V3 API، التي تبرز الكفاءة في التكلفة لرموز الإدخال والإخراج。; بالنسبة للنظام البيئي: إذا كان DSA يوفي ما يعد به، فقد ينتقل موجة تقنيات الانتباه الاقتصادية إلى مسارات الاستدلال السائدة (مثل

Quelle: deepnewz.com
وصفات/أدلة نشر vLLM
). ما زالت الأسئلة المفتوحة: مدى موثوقية DSA عبر النطاقات (الكود، استخدام الأدوات، تعدد اللغات، الاسترجاع)؟ هنا تساعد منافذ مقياسية مفتوحة قابلة لإعادة الإنتاج واختبارات مستقلة طويلة المدى. مدى استدامة التخفيضات عبر المناطق وأوقات اليوم؟ جداول السعر الشفافة ومسارات الاستخدام الفعلية ستكون مفيدة. ما الدور الذي تلعبه معلومات التدريب والبنية التحتية الجديدة (مثل التكاليف، الأجهزة) للنُسخ القادمة – وكيف يتم التحقق منها؟ خلاصة: DeepSeek V3.2-Exp ليست ضربة كبيرة، بل بروفة عملية ذات جدوى. يعد DSA بتقليل استهلاك الحوسبة عند السياقات الطويلة، ويدعمه المزود من خلال تخفيضات الأسعار وتوفير الوصول المفتوح. بالنسبة للمطورين والشركات، يعني ذلك المقارنة العملية، قياس أحمال العمل الفعلية، وإعادة التفاوض بشأن جانب التكلفة – مع مراعاة الاستقرار والامتثال والأمان المستقبلي.;
„fast keinem Einfluss“ und betont langfristige Partnerschaften statt reiner API-Transaktionen, wie . Sam Altman .

Quelle: deepseekv3.org
. ; .
Quelle: YouTube