عائلة نوى الذراع C1 يُمثل هذا الجيل نقلة نوعية في عالم الأجهزة المحمولة والخفيفة، إذ يستبدل معالج Cortex المألوف بتركيز أوضح على الأداء والكفاءة المستدامة. يأتي هذا الجيل مزودًا بـ منصة لومكس وبهدف واضح: تسريع الذكاء الاصطناعي على الجهاز نفسه دون المساس بالبطارية أو درجة الحرارة.
إلى جانب تغيير الاسم، يجمع الاقتراح بين هندسة Armv9.3-Aإعادة تصميم جذرية لنظام الذاكرة، وتعزيز كبير لقدرات الحوسبة المصفوفية. والنتيجة هي تحسينات واسعة النطاق في الأداء مع انخفاض استهلاك الطاقة، بالإضافة إلى خارطة طريق مصممة للهواتف الذكية والأجهزة اللوحية وأجهزة الكمبيوتر المحمولة والأجهزة القابلة للارتداء.
الهندسة المعمارية والميزات الجديدة لنواة Arm C1

يتم تنظيم سلسلة C1 في أربعة إصدارات: سي 1-ألترا (أقصى أداء) سي 1 بريميوم (أداء عالي في مساحة أقل)، سي 1 برو (التوازن) و سي 1-نانو (أقصى قدر من الكفاءة). يمكن لكل مُصنِّع دمج هذه الكتل في مجموعات غير متجانسة لإنشاء أنظمة على رقاقة (SoCs) مُكيَّفة مع نطاقات واستخدامات مختلفة، مع تكوينات ما يصل إلى 14 نواة.
قامت شركة ARM بتحسين كلٍّ من الواجهة الأمامية والخلفية، بما في ذلك تحسينات في التنبؤ، وذاكرة التخزين المؤقت، والتنفيذ غير المنظم. بفضل الربط الجديد وذاكرة التخزين المؤقت المشتركة الأكثر كفاءة (والتي تتطلب بيانات مكثفة)، خلايا SLC)، تقدم المنصة زيادات متوسطة تصل إلى 15% في الاستخدامات اليومية، والتي يمكن قياسها +30% على الأحمال الصعبة وتصل إلى قمم تصل إلى 45% في متعدد النواة.
يتطور دعم الذاكرة مع LPDDR6 لتقليل استهلاك الطاقة وزمن الوصول، مع الحفاظ على التوافق مع ذاكرة LPDDR5X بسرعات تصل إلى 9600 ميجابايت/ثانية. تُعزز قاعدة الذاكرة هذه، إلى جانب إعادة تصميم مجموعة الذاكرة، الأداءَ والاستجابةَ المُستدامَين في ظلّ الضغط الحراري.
C1-Ultra: سقف الأداء
باعتبارها جوهرًا من الطراز الأول، سي 1-ألترا تستهدف هذه التقنية أنظمة SoC الرائدة والمهام عالية الطلب، مثل التصوير الحاسوبي، ونماذج الذكاء الاصطناعي الكبيرة، وألعاب AAA المحمولة. وبالمقارنة مع Cortex-X925، تتحدث Arm عن... +25% في خيط واحد، وهو رقم يساعد على قياس الأداء العام عند دمجه مع المزيد من النوى في المجموعة.
تعمل الواجهة الأمامية على تحسين عرض النطاق الترددي L1 من التعليمات ودقة التنبؤ، بينما تعمل الواجهة الخلفية على زيادة نافذة التنفيذ خارج الترتيب بنحو 25%، لتصل إلى حوالي 2.000 تعليمات في آنٍ واحد. بالإضافة إلى ذلك، تتم مضاعفة سعة بيانات L1 إلى 128 كيلوبايت، وتتسارع سرعة قراءة L1 بنسبة 33% تقريبًا.
C1-Premium: أداء عالي في مساحة أقل
بالنسبة للأجهزة المتميزة التي لا تحتاج إلى الحد الأقصى المطلق، سي 1 بريميوم يحافظ على بنية قريبة جدًا من Ultra ولكن مع تخفيض المساحة بنسبة 35%تم تصميمه لتحقيق التوازن بين الأداء والتكلفة، مما يسهل التصميمات الأكثر إحكاما دون التضحية بأرقام كبيرة.
C1-Pro: التوازن والعضلات متعددة النواة
في الجزء المركزي، سي 1 برو يستبدل Cortex‑A725 بـ +11% كفاءة بنفس الاستهلاك ومع تحسينات الكفاءة التي تصل إلى ما يصل إلى 26% طاقة أقل بنفس الأداءفي مجال الألعاب، تستشهد شركة آرم بأرباح تبلغ حوالي + 16٪ في هذه الفئة من النوى.
المفاتيح موجودة في واجهة أمامية أكثر كفاءة (تنبؤ ثابت محسّن و BTB أكبر بكثير)، وواجهة خلفية ذات نطاق ترددي أوسع في L1D وزمن وصول أقل في L2 عند صحة التنبؤ. كما تم ضبط المتنبئ لتسريع الاستجابة في سيناريوهات العالم الحقيقي.
C1-Nano: الكفاءة فوق كل شيء
للمهام الخفيفة والتوفير الشديد، سي 1-نانو يزيد الكفاءة بحوالي 26% مقارنةً بسابقتها (مع الحفاظ على المنطقة سليمة تقريبًا، بنسبة تزيد عن ٢٪ مقارنةً بـ A2). تم فصل مراحل التنبؤ والاسترجاع لجلب التعليمات إلى المستوى الأول بشكل أسرع وتقليل فترات الانتظار في حال فشل التنبؤات.
بالإضافة إلى ذلك، معالجة المتجهاتيتم إيقاف تشغيل محركات الأقراص عندما يتعطل خط الأنابيب ويتم تقليل حركة المرور بين L3 وDRAM (حوالي 21% في المتوسط وما يصل إلى 39% تحت أحمال معينة)، مما يخفف الاستهلاك ويحسن الاستجابة.
C1-DSU: مجموعات مرنة واستهلاك أقل
الجديد C1-DSU يُنظّم اتصال النوى ضمن ذاكرة تخزين مؤقتة مشتركة من المستوى الثالث، ويُسدّ الفجوة مع بقية نظام SoC (ذاكرة الوصول العشوائي، ووحدة معالجة الرسومات، وما إلى ذلك). مقارنةً بالإصدارات السابقة، يُخفّض التصميم استهلاك الطاقة النموذجي للنظام بحوالي 1 11٪ وتأثير الذاكرة بنسبة 7% تقريبًا، بالاعتماد على أوضاع مثل القيلولة السريعة L3 لتقليل الخسائر عند عدم الاستخدام.
قطعة رئيسية أخرى هي دمج مسرعات SME2 كعناصر خارجية للنواة: في C1-Ultra وC1-Premium يكون وجودها إلزاميًا، بينما في C1-Pro وC1-Nano إنه اختياري حسب تصميم الشركة المصنعة. يمكن لأي نواة في المجموعة الوصول إليها عند وجودها، مما يتيح تركيبات متنوعة للغاية (على سبيل المثال، 2× C1‑Ultra + 6× C1‑Pro مع مُسرِّع واحد أو اثنين من مُسرِّعات SME2، أو تركيبات أكثر تواضعًا تجمع بين Pro وNano).
تتضمن منصة Lumex أيضًا جيلًا جديدًا من وحدات معالجة الرسومات. على الرغم من أن تركيز هذا الخبر ينصب على وحدات المعالجة المركزية، مالي G1 مصحوبًا بتحسينات بنسبة 20% تقريبًا في أداء الرسومات، يضاعف إنتاجية تتبع الأشعة ويقلل تكاليف الطاقة لكل إطار بنحو 9%، مما يعزز المزيج للألعاب التي تعتمد على وحدة معالجة الرسومات أولاً وأحمال عمل الذكاء الاصطناعي.
SME2 ودور وحدة المعالجة المركزية في الذكاء الاصطناعي

القفزة الكبيرة في الذكاء الاصطناعي تأتي مع SME2 (امتداد المصفوفة القابلة للتطوير 2)، مما يُسرّع عمليات ضرب المصفوفات، والمسندات المتعددة، وأنواع البيانات الجديدة (بما في ذلك الدقة المدمجة مثل 2b/4b)، وينسق مع SVE2 للمتجهات المتقدمة. في الأرقام الإجمالية، يتحدث Arm عن تحسينات متوسطة قدرها 3,7x مع انخفاض الاستهلاك بنحو 1 27٪.
في الحالات العملية، أظهرت الشركة انخفاضًا في زمن الوصول بنسبة 4,7x في التعرف على الكلام (قاعدة الهمس)، تسريعات بمقدار 2,4–2,8x في النص إلى الكلام وزيادات كبيرة في توليد الرموز لـ LLM (على سبيل المثال Gemma 3) والتي تقترب من × 5يؤدي التشغيل على وحدة المعالجة المركزية إلى تجنب عمليات النقل إلى مسرعات أخرى، مما يقلل من أوقات الانتظار ويوفر الاستجابة.
بالنسبة للأحمال الصغيرة أو التفاعلية، تأخذ وحدة المعالجة المركزية مركز الصدارة مرة أخرى: مع SME2يتم إنجاز العديد من المهام اليومية (مثل تحسين الصورة محليًا، والتجزئة، والتصنيف، وتأثيرات الكاميرا، والصوت) بشكل أسرع، وبتكلفة أقل، ودون الحاجة إلى المرور عبر الشبكة. عند زيادة الطلب، يمكن لوحدة معالجة الرسومات (GPU) أو وحدة معالجة عصبية خارجية الاستمرار في تولي المهمة، لكن وحدة المعالجة المركزية (CPU) لم تعد تُشكّل عائقًا.
يتوفر أيضًا دعم للبرمجيات: يوجد تكامل في لينكس وأندرويد 16، وسلاسل الأدوات والمكتبات المحسنة (KleidiAI)، والتوافق مع المحركات مثل Unity وUnreal Engineوسيؤدي هذا إلى تسهيل اعتماد التطبيقات والألعاب لهذه التحسينات بسرعة مع وصول أنظمة SoC التجارية الأولى.
منصة لوميكس CSS يجمع كل القطع معًا (وحدة المعالجة المركزية C1، ووحدة معالجة الرسومات Mali G1، والتوصيل والذاكرة) بتصميمات جاهزة للإنتاج 3 نانومتر، القياس عن بعد للأجهزة و توافق نظام ARM مع LPDDR6. يتيح هذا للشركاء تسريع مشاريعهم الخاصة بالأجهزة المحمولة والكمبيوتر المحمول باستخدام مجموعات قابلة للتطوير تصل إلى 14 نواة وقدرات ذكاء اصطناعي مدمجة بالجهاز.
يجمع الذراع C1 بين الأداء المستدام, كفاءة وتقدم SME2 دفعة حقيقية للذكاء الاصطناعي على وحدات المعالجة المركزية؛ فهي توفر مرونة C1-DSU لتكييف المجموعات مع كل مجموعة من المنتجات وتشكل أساسًا متينًا للموجة التالية من أنظمة SoC المحمولة والمحمولة التي تسعى إلى تحقيق التوازن بين الطاقة والاستقلالية وقدرات الذكاء الاصطناعي دون الاعتماد دائمًا على السحابة.