شاومي تكشف عن نموذج صوتي ذكي جديد
أعلنت شركة شاومي عن إطلاق نموذجها الصوتي الذكي مفتوح المصدر MiDashengLM‑7B، والذي يمثل خطوة مبتكرة لتعزيز تقنياتها في مجالات السيارات الكهربائية والأجهزة المنزلية الذكية. يعتمد هذا النموذج على التكنولوجيا المتقدمة لمنصة Xiaomi Dasheng، مما يسمح له بفهم الكلام والأصوات البيئية والموسيقى بشكل دقيق.
يُستخدم MiDashengLM-7B معمارية صوتية متطورة، ويستفيد من نموذج Qwen2.5-Omni‑7B لفك الترميز، مما يمنحه القدرة على التقاط المشاعر والصدى المكاني للأصوات. وقد حقق النموذج أداءً متفوقًا في اختبارات متعددة، حيث أظهر سرعة استجابة تفوق نماذج أخرى بنسبة 75% وسرعة معالجة متزامنة تزيد بنحو 20 ضعفًا.
تمكّن نموذج شاومي أيضًا من تجاوز نماذج شهيرة مثل Whisper وKimi-Audio في فهم المهام الصوتية، خصوصًا تلك غير المرتبطة بالكلام. كما يُعزز Dasheng تقنيات مثل إزالة الضجيج وتحسين جودة الصوت، حيث تم تطبيقه في مؤتمرات دولية مثل Interspeech 2025.
من ناحية الكفاءة الحسابية، يمكن للنموذج معالجة دفعات تصل إلى 512 عينة صوتية في بيئة ذاكرة 80 جيجابايت، مع تقليل متطلبات الحساب بنسبة 80%. بُني النموذج باستخدام بيانات عامة مفتوحة المصدر تصل إلى 1.1 مليون ساعة تتناول مختلف أنواع المحتوى الصوتي.
يسعى نموذج MiDashengLM إلى تقديم تجارب صوتية شخصية، بما في ذلك دعم تعلم اللغات وتقديم ملاحظات أثناء قيادة السيارة. وقد أُصدر بموجب رخصة Apache 2.0، مما يسمح للمطورين باستخدامه بحرية، مع دعوة للمجتمع للمساهمة في تطويره عبر GitHub.
عدد المصادر التي تم تحليلها: 2
المصدر الرئيسي : الشرق
معرف النشر: TECH-060825-897

