تكنولوجيا

مقارنة بين نموذجي OpenAI o3-mini و DeepSeek-R1

%d9%85%d9%82%d8%a7%d8%b1%d9%86%d8%a9 %d8%a8%d9%8a%d9%86 %d9%86%d9%85%d9%88%d8%b0%d8%ac%d9%8a Openai O3 Mini %d9%88 Deepseek R1

مقارنة بين نموذجي OpenAI o3-mini و DeepSeek-R1

أطلقت شركة OpenAI مؤخرًا نموذج o3-mini، بعد فترة قصيرة من إصدار نموذج DeepSeek-R1 الذي تم تطويره في الصين. يصنف كلا النموذجين ضمن النماذج اللغوية المتقدمة، مما أثار اهتمام المطورين والباحثين.

اختبار LiveBench

تُظهر نتائج اختبار LiveBench الأداء العام لكل من النموذجين. حيث حصل o3-mini على 73.94، بينما حصل DeepSeek-R1 على 71.38. وفي مجال التفكير والاستدلال، حقق o3-mini نتيجة 89.58 مقارنة بـ 83.17 لـ DeepSeek-R1، مما يعكس قوة التحليل لديه. في البرمجة، تفوق o3-mini أيضًا بنتيجة 82.74 مقابل 66.74 لـ DeepSeek-R1.

بخصوص الرياضيات، حصل DeepSeek-R1 على 79.54 متفوقًا على o3-mini الذي حقق 65.65. ومع ذلك، أظهر o3-mini أداءً طفيفًا أفضل في تحليل البيانات والمهام اللغوية.

اختبارات إضافية

في اختبار NYT Connections، حصل o3-mini على 72.4، ليتفوق بفارق ملحوظ على DeepSeek-R1 الذي حصل على 54.4. أما في اختبار Humanity’s Last Exam، بلغت دقة o3-mini 13.0% بينما DeepSeek-R1 حقق 9.4%.

التكلفة

تظهر المقارنة أن o3-mini أغلى في الاستخدام بتكلفة 55 سنتًا لكل مليون رمز إدخال، مقابل 14 سنتًا لـ DeepSeek-R1.

الخلاصة

رغم تفوق o3-mini في الأداء العام والاستدلال والبرمجة، إلا أن DeepSeek-R1 يُعتبر خيارًا اقتصاديًا لمن يسعى لتكاليف أقل، خاصة في التطبيقات التي تركز على البرمجة والرياضية.



عدد المصادر التي تم تحليلها: 5
المصدر الرئيسي : aitnews.com آية رضوان
post-id: 589ac172-6ecd-44de-af58-3aaa9b796a98

تم نسخ الرابط!
1 دقيقة و 9 ثانية قراءة