تكنولوجيا

يستوعب المشاعر والمعاني.. شاومي تكشف عن نموذج ذكي لإنشاء الأصوات

76a65d39 e0a3 42f9 8fb0 b65e1c17d49b file.jpg

شاومي تكشف عن نموذج صوتي ذكي جديد

أعلنت شركة شاومي عن إطلاق نموذجها الصوتي الذكي مفتوح المصدر MiDashengLM‑7B، والذي يمثل خطوة مبتكرة لتعزيز تقنياتها في مجالات السيارات الكهربائية والأجهزة المنزلية الذكية. يعتمد هذا النموذج على التكنولوجيا المتقدمة لمنصة Xiaomi Dasheng، مما يسمح له بفهم الكلام والأصوات البيئية والموسيقى بشكل دقيق.

يُستخدم MiDashengLM-7B معمارية صوتية متطورة، ويستفيد من نموذج Qwen2.5-Omni‑7B لفك الترميز، مما يمنحه القدرة على التقاط المشاعر والصدى المكاني للأصوات. وقد حقق النموذج أداءً متفوقًا في اختبارات متعددة، حيث أظهر سرعة استجابة تفوق نماذج أخرى بنسبة 75% وسرعة معالجة متزامنة تزيد بنحو 20 ضعفًا.

تمكّن نموذج شاومي أيضًا من تجاوز نماذج شهيرة مثل Whisper وKimi-Audio في فهم المهام الصوتية، خصوصًا تلك غير المرتبطة بالكلام. كما يُعزز Dasheng تقنيات مثل إزالة الضجيج وتحسين جودة الصوت، حيث تم تطبيقه في مؤتمرات دولية مثل Interspeech 2025.

من ناحية الكفاءة الحسابية، يمكن للنموذج معالجة دفعات تصل إلى 512 عينة صوتية في بيئة ذاكرة 80 جيجابايت، مع تقليل متطلبات الحساب بنسبة 80%. بُني النموذج باستخدام بيانات عامة مفتوحة المصدر تصل إلى 1.1 مليون ساعة تتناول مختلف أنواع المحتوى الصوتي.

يسعى نموذج MiDashengLM إلى تقديم تجارب صوتية شخصية، بما في ذلك دعم تعلم اللغات وتقديم ملاحظات أثناء قيادة السيارة. وقد أُصدر بموجب رخصة Apache 2.0، مما يسمح للمطورين باستخدامه بحرية، مع دعوة للمجتمع للمساهمة في تطويره عبر GitHub.


عدد المصادر التي تم تحليلها: 2
المصدر الرئيسي : الشرق
معرف النشر: TECH-060825-897

تم نسخ الرابط!
1 دقيقة و 9 ثانية قراءة