Grok Imagine: منافس ذكاء اصطناعي للفيديو من xAI

Lisa Ernst · 09.10.2025 · التقنية · 5 min

قدمت xAI Grok Imagine الإصدار v0.9، وهو إصدار جديد من مولِّد الفيديو الخاص بها. يُروَّج لجودة صورة محسّنة، حركات أكثر سلاسة، ومسار صوتي أصلي مع مزامنة شفاه دقيقة. الإعلان يأتي مباشرة بعد إطلاق OpenAI لـ Sora 2 ويعزّز المنافسة في مجال الذكاء الاصطناعي للفيديو التوليدي

مقدمة

Grok Imagine هو وحدة الصور والفيديو من xAI، مدمجة في تطبيق Grok ونظام X البيئي. يصف المستخدمون مشهدًا بنص، مع خيار صورة مرجعية، ويتلقون مقاطع قصيرة مع مسار صوتي. تشير xAI تقنيًا إلى نهج Aurora نهج Aurora, ، وهو إطار عمل autoregressive للصورة والتعدد الوسائط، الذي أعلنت عنه الشركة في نهاية عام 2024. تقارير إعلامية تصنف Aurora كنظام autoregressive قائم على الرموز، يختلف عن نماذج التشتت الكلاسيكية ويدّعي تحكماً دقيقاً في الصورة وربما في إطارات الفيديو (TechCrunch). في أغسطس، تناولت وسائل الإعلام Grok Imagine ووضعه „Spicy“ المثير للجدل، الذي يسمح أحياناً بمحتويات صريحة مقارنة بالأدوات الأكثر تقييداً (The Verge, TechCrunch).

التكنولوجيا والتطوير

في 7 و8 أكتوبر 2025، أعلنت xAI عن Grok Imagine الإصدار v0.9 على X. مقارنةً بالإصدار 0.1، وُعِدت ترقيات ضخمة في جودة الصورة، الحركة وتوليد الصوت. تُظهر العروض التوضيحية حركات فم دقيقة، وغناء، وتصوير كاميرا أكثر واقعية منشور رسمي يقتبس „Now available for free on all our products“, مما يوحي بإتاحة واسعة، لكن دون تفاصيل استخدام أو حصص (Gigazine, X). وتشير عدة تقارير أيضاً إلى تقصير كبير في أوقات الانتظار؛ وفي بعض الحالات يتحدث عن توليد فيديو في أقل من 15 ثانية، مما سيزيد من سرعة سير العمل بشكل واضح (Gigazine, X). قبل عدة أيام فقط كشفت OpenAI عن Sora 2 بتقدم واضح في الفيزياء والواقعية والتحكم، وكذلك الصوت المتزامن (Livemint). (OpenAI).

Grok Imagine وغيرها من أدوات الفيديو التوليدية المماثلة تتيح إنشاء سيناريوهات معقدة وخيالية تتجاوز الواقع.

المصدر: jagranjosh.com

Grok Imagine وغيرها من أدوات الفيديو التوليدية المشابهة تتيح إنشاء سيناريوهات معقدة وخيالية تتجاوز الواقع.

التحليل والسياق

xAI يهدف إلى ترسيخ Grok كقناة إنتاج إبداعية في X: مقاطع قصيرة، صوت في الأعلى، تحكّم يعتمد على الصوت أولاً، وكل ذلك بدون تبديل أدوات. وهذا يقلل من اختلالات سير العمل في تدفقات المحتوى ويزيد احتمال انتشار المحتوى بشكل فيروسي مباشرة على X. (Gigazine). في الوقت نفسه، تضع xAI نفسها في مواجهة Sora 2 وعروض مماثلة، التي تثير حالياً صدىً وانتقادات واسعة حول حقوق النشر والتزييف العميق والتراخيص. ترتفع نقاشات الحقوق وسوء الاستخدام، كما يظهر من قضايا Sora وردود فعل قطاع الصناعة. (The Verge, Reuters).

المصدر: يوتيوب

حقائق وادعاءات

ثبُت وجود Grok Imagine الإصدار v0.9 مع تحسينات في الصورة والحركة والصوت، إضافة إلى مقاطع الأمثلة المنشورة بما في ذلك مزامنة الشفاه (Gigazine, X). كما يثبت أيضاً أن Sora 2 قد تم عرضه رسميًا في 30 سبتمبر 2025، ويقدم صوتاً متزامناً وتحكماً أكثر، مما يفسر زيادة الضغط التنافسي (OpenAI).

من غير الواضح ما إذا كان v0.9 يدعم باستمرار «نص إلى فيديو» دون شاشة بدء. التصنيفات السابقة أكّدت «الصورة إلى فيديو»، فقط التعبير الجديد والعروض التوضيعية يشير إلى النص إلى مقطع. دون وثائق تقنية تبقى تفاصيل خط أنابيب البرمجيات غير واضحة (The Verge, Gigazine).

عبارة „متاح مجاناً على جميع منتجاتنا“ قد توحي بانفتاح واسع، إلا أن xAI قد رتّبت الميزات والأسعار في الماضي عدة مرات. ما إذا كان 'مجاناً' دائماً وعالمياً أم مرتبطاً بحدود غير واضح دون صفحة تسعير (Gigazine, Economic Times).

الافتراض بأن محتويات Spicy آمنة ليس صحيحًا. حتى في أغسطس كانت كثافة القواعد موضوع جدل، وهناك مخاطر للإساءة موثقة. الرسائل الدعائية دون إشارة إلى الأخلاق أو الرقابة أو الحدود القانونية تشوّه الصورة (The Verge, Time).

يضع Sora من OpenAI المعايير في مجال الذكاء الاصطناعي للفيديو التوليدي، ويتعيّن على منافسين مثل Grok Imagine القياس بها

المصدر: besirious.net

يضع Sora من OpenAI المعايير في مجال الذكاء الاصطناعي للفيديو التوليدي، ويتعيّن على منافسين مثل Grok Imagine قياس أنفسهم بها

يعجب المؤيدون بالوتيرة والمظهر 'الخارج عن الصندوق' للمقاطع؛ حسابات X ذات وصول واسع والمختبرين المبكرين ترفع من مدى الرؤية (Gigazine, X). أصوات نقدية تحذر من التزييف العميق، وانتهاكات حقوق الخصوصية وثغرات في الرقابة والشفافية، وهو ما يظهر بالفعل في قضايا Sora وتأكيدات الصناعة كمثال (Reuters, Axios).

التداعيات والأسئلة المفتوحة

لمبدعي المحتوى، يسرّع v0.9 القصص المصوّرة والPreviz ومقاطع وسائل التواصل الاجتماعي. الصوت الواقعي ومزامنة الشفاه النظيفة يوفران وقت ما بعد الإنتاج، وهو أمر مهم بشكل خاص في التنسيقات القصيرة (Gigazine). قبل النشر، يجب فحص حقوق النماذج والعلامات التجارية وحقوق الشخصية وتوثيق المصادر. تزوّدك الإرشادات من بين أمور أخرى بالنقاشات المستمرة والمقالات الرائدة حول منع إساءة الاستخدام (The Verge) وكذلك إشارات رسمية من المزودين، مثل OpenAI للوقاية من المخاطر، والتي يمكن نقلها فكرياً إلى أدوات أخرى (OpenAI).

المصدر: eonmsk.com

قدرات Grok Imagine التوليدية تتيح إنشاء شخصيات ومشاهد متعددة التفاصيل، من روبوتات إلى إلفين خيالية

تتعلق الأسئلة المفتوحة بالمواصفات التقنية الدقيقة لـ v0.9 في قسم الفيديو من Aurora. هل هو قائم بالكامل على النص أم لا يزال رئيسياً يعتمد على الصورة إلى الفيديو؟ هنا يفتقد إلى ورقة بيضاء، مقاييس معيارية وبيانات API واضحة (x.ai). كيف تبدو الحدود الاستخدامية الملزمة والمتاحة علناً، ودرجات الأسعار وقواعد الإشراف، خصوصاً في ظل وضع Spicy (The Verge)? ما هي علامات مائية (Watermark) أو إثباتات الأصل المقترحة، ومدى قوة مقاومتها للإزالة، في سياق نقاش التزييف العميق الحالي (Reuters, Time)?

المصدر: يوتيوب

Grok Imagine الإصدار v0.9 يقدم إشارات قوية: توليد أسرع، وضوح أعلى في تماسك الصوت والصورة، وعروض توضيحيّة تقنع بدون استخدام برنامج التحرير. ما يهم على المدى القصير هو الدقة: اختبار سير العمل، فحص الحقوق، توثيق المصادر. ما يهم على المدى المتوسط هو الشفافية: تفاصيل التقنية والاستخدام بوضوح من xAI وإرشادات الحماية الموثوقة. فقط عندما تكون هذه القطع مجتمعة بشكل صحيح، ستتحول عرضاً مثيراً إلى معيار إنتاج قابل للاعتماد (Gigazine, OpenAI).

Grok Imagine: منافس ذكاء اصطناعي للفيديو من xAI

مقدمة

التكنولوجيا والتطوير

التحليل والسياق

حقائق وادعاءات

التداعيات والأسئلة المفتوحة

حول Zerlo

روابط

وسائل التواصل الاجتماعي