OpenAI FM: إذاعة المستقبل
openai.fm هي عرض رسمي من OpenAI يوضح قدرات تحويل النص إلى كلام (TTS) في واجهة OpenAI API. إنها تتيح توليد أصوات ذكاء اصطناعي عالية الجودة للفيديوهات، أو البودكاست، أو النماذج الأولية. الاستخدام مجاني، أما الإنتاج المستمر للصوت عبر الـ API فهو مدفوع.
مقدمة
openai.fm يعمل كموقع تفاعلي لعرض قدرات تحويل النص إلى كلام في OpenAI API. يمكن للمستخدمين إدخال نص، اختيار صوت، والاستماع فوراً إلى النتيجة. هذا كعرض تجريبي لإظهار الجودة وسهولة الدمج. الكود الأساسي موجود على GitHub verfügbar ويوضح كيف يمكن للمطورين دمج Speech-API في تطبيقاتهم الخاصة.
أصدرت OpenAI في 2025 نماذج صوتية جديدة، بما في ذلك تحسينات في التعرف على الكلام (gpt-4o-transcribe) ونموذج TTS قابل للتحكم باسم gpt-4o-mini-tts. يمكن للمطورين الآن تحديد، بشكل مفصل، كيف يجب أن يتكلم الصوت. يعمل openai.fm كنافذة عرض رسمية لهذه الوظائف وهو مرتبط في GitHub كمستودع OpenAI يستخدم كود Next.js الذي يصل مباشرة إلى Speech-API.
Die Demo ist frei zugänglich, aber die produktive Nutzung über die API ist kostenpflichtig. Die Preise werden von OpenAI pro Token oder je nach Realtime-/Audio-Nutzung abgerechnet. Die aktuellen Sätze sind transparent in der Preisliste aufgeführt.
آلية العمل والنماذج
„Text-to-Speech“ (TTS) هو العملية التي يتم فيها تحويل النص المكتوب إلى كلام منطوق. توفر OpenAI لهذا الغرض نماذج مختلفة، من بينها gpt-4o-mini-tts. . Die verfügbaren Stimmen tragen Namen wie Alloy, Echo, Fable, Onyx, Nova oder Shimmer. Diese Stimmen sind über die API zugänglich und können in Anwendungen integriert werden.
openai.fm هي عرض رسمي من OpenAI، وهو ما يؤكده مبنى GitHub مستودع GitHub, يؤكده أنه ينتمي إلى منظمة OpenAI ويصف هذا الغرض. أصوات TTS مثل Alloy وEcho وFable وOnyx وNova وShimmer مدرجة وتتم استخدامها عبر الـ API.

Quelle: listoru.hatenablog.com
تتيح واجهة المستخدم البديهية لـ OpenAI FM اختيار الأصوات والنبرات بسهولة لتوليد الكلام من النص.
التكاليف والاستخدام
تُتاح النسخة التجريبية على openai.fm مجاناً وتستخدم لاختبار وظائف الـ API. أما الاستخدام المستمر والإنتاجي لميزة تحويل النص إلى كلام عبر الـ API فهناك تكاليف. استخدام الـ API مدفوع، وتُذكر الأسعار في قائمة الأسعار الرسمية لـ OpenAI مفصّلة في القائمة. يتم احتساب الرسوم حسب كل توكن أو بناءً على استخدام الوقت الحقيقي/الصوت.
من الخداع الاعتقاد بأنه يمكن لـ openai.fm إنتاج صوت مجاني بلا حدود بشكل دائم. العرض يعرض الوظائف فقط؛ لإنتاج الصوت عبر الـ API هناك رسوم. تتفاوت «تكاليف الدقيقة» لكل صوت TTS حسب طريقة الفوترة (توكنات، صوت الزمن الحقيقي) والنموذج. أسعار الدقيقة الثابتة من المنتديات هي تقديرات وليست معياراً.
لماذا تقدم OpenAI عرضاً يمكن استخدامه بحرية؟ العروض التجريبية تخفض الحاجز لتجربة الميزات الجديدة – للمبدعين والشركات الناشئة والفرق. وبذلك تُظهر OpenAI كيف تبدو الأصوات ومدى سهولة التكامل. وهذا يبني الثقة في الجودة والكمون قبل ربط الميزانيات. للاختبارات السريعة والعروض التجريبية والنماذج الأولية، فإن openai.fm مثالياً. أما للإنتاج مثل التعليقات الصوتية على YouTube أو التعلم الإلكتروني أو التطبيقات، فيجب تخطيط تكاليف الـ API.

Quelle: genspark.ai
الاستخدام الاحترافي لـ OpenAI FM في مجالات تطبيقية مختلفة.
الجوانب الأمنية وسوء الاستخدام
هناك قضايا أمان مهمة حول أصوات الذكاء الاصطناعي. OpenAI لم تقم بإطلاق أداة استنساخ صوتي قوية تُسمى „Voice Engine“ علناً لأسباب تتعلق بسوء الاستخدام، مثل الاحتيال الهوية. الاختبارات تجري فقط مع شركاء بموجب شروط صارمة. هذا الاحتياطي يؤثر أيضاً على الأصوات التي يتم تفعيلها في الـ API: يتم توفير أصوات مُعدة مسبقاً بدلاً من هويات قابلة للاستنساخ.
من الخطأ أو المضلل الادعاء بأن OpenAI يوفر استنساخ صوتي مجاني لكل صوت. OpenAI لم تطرح استنساخ الصوت علناً لأسباب أمان. تغطيات الإعلام عن أصوات الذكاء الاصطناعي غالباً ما تتعلق بحقوق والتشابه مع أشخاص حقيقيين. حالة بارزة كانت صوت „Sky“ التي أوقفه بسبب انتقادات سكارليت جوهانسون. أكدت OpenAI أن الصوت يعود لممثلة أخرى.
وبالمثل تروج مواقع طرف ثالث لـ TTS مجانية. مواقع مثل openai-fm.com أو ttsopenai.com هي مزودات مستقلة بلا صلة بالنطاق الرسمي لـ OpenAI. إنها تعد بتقديم TTS مجاني، لكنها ليست جزءاً من منصة OpenAI. من أجل الجدية، من المهم فحص البيان القانوني، سياسات الخصوصية، الحدود، ونموذج أعمال هؤلاء المزودين.
Quelle: يوتيوب
يعرض DevDay-Breakout مباشرة كيف تتفاعل واجهات Real-time وAudio من أجل وكلاء الصوت – مفيد كإطار لفهم الكمون والتحكم والهندسة.
التطبيق العملي
للاختبارات السريعة والعروض التجريبية والنماذج الأولية، يعتبر openai.fm مثالياً. أما للإنتاج، مثل التعليقات الصوتية على YouTube أو التعلم الإلكتروني أو التطبيقات، فيجب تقدير تكاليف الـ API وأخذ الحقوق والكشف ومكافحة الاستخدام السيئ بعين الاعتبار. وتشمل النصائح العملية استخدام الأصوات المعرفة مسبقاً وتجنب استنساخ أشخاص حقيقيين. من المستحسن وضع وسم لصوت AI في المشاريع والتحقق من الوثائق الرسمية والمستودعات بدلاً من الاعتماد على تشابه الأسماء. ونقاط الانطلاق هي TTS-Guides و توثيق النماذج.
الأسئلة المفتوحة تتعلق بتطوير الأصوات المعدة مسبقاً وإضافة لغات ونُطق جديدة. ولذا من المفيد الاطلاع على سجل التغييرات والتوثيق المحدث بانتظام. متى وبأي شروط سيُتاح توسيع استنساخ الصوت، يظل سؤالاً مفتوحاً. تشير OpenAI إلى تقييمات أمان جارية ومشروعات تجريبية مع شركاء؛ ولا يوجد موعد محدد علنياً.

Quelle: user-added
إعلان عن نموذج نص-إلى-نموذج جديد من OpenAI.fm.
يُظهر openai.fm بشكل مدهش مدى قوة أصوات الذكاء الاصطناعي الحديثة – مجاناً كعرض تجريبي، لكنه ليس منصة إنتاج بلا حدود. للمشروعات الجدية، الطريق إلى الاستخدام يجب أن يكون عبر الـ API الرسمي بأسعار واضحة، وأصوات مُعدة مسبقاً، وخطوط أمان. من يعمل بنزاهة ويربط المصادر ويعلِم صوت الذكاء الاصطناعي ويعتمد على الوثائق الرسمية والمستودعات، يمكنه بسرعة بناء سير عمل موثوق من مجرد عرض تجريبي.
Quelle: يوتيوب
دليل تعليمي يشرح استخدام openai.fm وأخطاء التصدير الشائعة.