لقد اتخذت الذراع الخطوة وتقدم Lumex، منصة نظام الحوسبة الفرعي (CSS) الأكثر طموحًا حتى الآن، والتي تم تصميمها لدفع الذكاء الاصطناعي على الجهاز نفسه على كل من الهواتف المحمولة المتطورة وأجهزة الكمبيوتر من الجيل الجديد.
ويجمع الاقتراح بين كتل الأجهزة والبرامج جاهز للدمج في نظام على رقاقة: جديد وحدة المعالجة المركزية Arm C1 مع SME2, GPU مالي G1، والترابط ومجموعة تطوير مُحسّنة، من أجل تمكين تجارب مثل الترجمة في الوقت الفعلي، ومساعدين أكثر سياقية y ألعاب ذات رسومات متقدمة دون الاعتماد بشكل دائم على السحابة.
ما هو Lumex وما التغييرات التي يطرأ عليها مقارنة بالمنصات الأخرى؟
إلى جانب مجموعة من عناوين IP الفضفاضة، فإن Lumex هي نظام فرعي مرجعي جاهز لتقنية 3 نانومتر التي يمكن للمصنعين اعتمادها كما هي أو تكوين لقياس، مما يقلل من أوقات التكامل ويضمن الأداء من السيليكون الأول.
كما أطلقت شركة Arm أيضًا التسمية المتجددة بالنسبة لكتلها: تنتقل عائلة وحدة المعالجة المركزية إلى C1 (مع C1-Ultra وC1-Premium وC1-Pro وC1-Nano) ووحدة معالجة الرسوميات إلى مالي G1 (G1-Ultra وG1-Premium وG1-Pro)، مع SME2 كأصل عظيم لتسريع الذكاء الاصطناعي على وحدة المعالجة المركزية.
وحدة المعالجة المركزية Arm C1: الهندسة المعمارية وSME2 والقفزة في الأداء
الكتلة الذراع C1 تم بناؤه على Armv9.3 ويمكن توسيع نطاقه إلى النوى 14، مع دعم ل LPDDR6 (مع الحفاظ على التوافق مع LPDDR5X). C1-DSU يقوم بتنسيق النوى تحت ذاكرة التخزين المؤقت L3 المشتركة ويضيف تحسينات الكفاءة على الجيل السابق.
ال تعليمات SME2 إلزامية في C1-Ultra وC1-Premium واختياري في C1-Pro وC1-Nano، مما يسمح بزيادة الأداء في أحمال عمل الذكاء الاصطناعي على وحدة المعالجة المركزية دون تكلفة نقل البيانات إلى مسرعات أخرى.
وفقًا لشركة Arm، تقدم مجموعة C1 مع SME2 أداء الذكاء الاصطناعي يصل إلى 5 مرات أكثر، يقلل من زمن انتقال الصوت تصل إلى 4,7 مرة وتسريع توليد الصوت 2,8 مرة مقارنة بالجيل السابق.
إلى جانب الذكاء الاصطناعي، فإن الهندسة المعمارية الجديدة تجلب تحسن متوسط بنسبة 15% في الاستخدام اليومي، حتى 30% في الأحمال الصعبة وقمم 45% في متعدد النواة، بمساعدة تحسينات الواجهة الأمامية والتنبؤ ونوافذ التنفيذ خارج الترتيب.

وحدة معالجة الرسوميات Mali G1: مزيد من تحسينات تتبع الأشعة والذكاء الاصطناعي
La مالي G1-ألترا يقدم أ وحدة تتبع الأشعة من الجيل التالي (RTUv2) والوعود ضعف الأداء في تتبع الأشعة مقارنة بالسابقة، إلى جانب أداء رسومي أعلى بنسبة 20% y 9% طاقة أقل لكل إطار.
في الذكاء الاصطناعي/التعلم الآلي، تضيف وحدة معالجة الرسوميات مسارات FP16 لضرب المصفوفة وتحقق ما يصل إلى 20٪ المزيد من الاستدلال، تحسين المهام مثل التعرف على الكلام والتجزئة الدلالية o تحسين الصورة مقارنة بالجيل السابق.
العائلة اكتملت بـ G1-بريميوم (6-9 أنوية، بدون تتبع الأشعة) و جي 1 برو (1-5 نوى)، في بنية قابلة للتطوير تعمل على مضاعفة الشبكة الداخلية ومناطق التخزين المؤقت لتقليل الازدحام وزيادة النطاق الترددي.
البرمجيات والنظام البيئي: دعم KleidiAI والإطار
ترافق المنصة الأجهزة بمجموعة مصممة للمطورين للاستفادة منها SME2 ومالي G1 بدون أي تغييرات كبيرة على تطبيقاتك: كليدياي يتكامل مع ExecuTorch (PyTorch)، وONNX Runtime، وGoogle LiterRT، وغيرها.
يعمل Arm أيضًا مع أندرويد 16، لينكس ومحركات مثل الوحدة واللاواقعية حتى تصل تحسينات الذكاء الاصطناعي والرسومات بطريقة ما أوتوماتيكي للألعاب والتطبيقات المتوافقة.
Lumex CSS لأنظمة 3nm SoC: التكامل والقياس عن بُعد
تتضمن حزمة CSS التصاميم المادية جاهزة لـ 3 نانومتر في العقد الرئيسية، مع ملفات تعريف الطاقة/الأداء/المساحة التي تم التحقق من صحتها بالفعل، والتي يختصر الوقت اللازم لطرح المنتج في السوق ويقلل من المخاطر في الشريط اللاصق.
تم اضافتهم أدوات القياس عن بعد وعلى منصة مرجعية لتسهيل عملية الإعداد حسب النموذج، بالإضافة إلى مرونة C1-DSU لتكييف المجموعات والمعجلات مع كل جزء.
التبني: الأهداف والأجهزة المستهدفة
تخطط شركة آرم لجلب هذه التكنولوجيا إلى 3.000 مليون جهاز طوال الدورة، مع قدرة حوسبة الذكاء الاصطناعي الإجمالية تتجاوز 10.000 مليار توبس بينهم جميعًا، تاركين الشركاء حرية التكامل اعتمادا على المنتج.
في الممارسة العملية، سوف نرى هواتف أندرويد مع ميزات الذكاء الاصطناعي المحلية الأسرع، المحمول المعالجات المستندة إلى ARM والتي تستفيد من SME2 ووحدات معالجة الرسومات المحدثة، والتصميمات التي تعطي الأولوية كفاءة o أداء اعتمادا على السوق.
باستخدام Lumex، يحاول Arm تسريع القفزة إلى الذكاء الاصطناعي المفيد والخاص ومنخفض الكمون على الجهاز، بالاعتماد على وحدة المعالجة المركزية C1 مع SME2، ووحدة معالجة الرسومات Mali G1 وقاعدة CSS جاهزة لـ 3nm؛ وهي تركيبة تهدف إلى أداء أفضل y استهلاك أقل دون التضحية بالمرونة التي يطلبها المصنعون.
