الدفعة الجديدة من عناوين IP من SiFive إنها تصل بقدم قوية وبمهمة تغطية كل شيء: من إنترنت الأشياء والروبوتات إلى قلب مراكز البياناتوتقدم الشركة الجيل الثاني من عائلة Intelligence بخمسة عناصر رئيسية: X160 الجيل الثاني، X2 الجيل الثاني، X180 الجيل الثاني، X2 الجيل الثاني وXM الجيل الثاني، وكلها تعتمد على بنية RISC-V وتركز على أحمال عمل الذكاء الاصطناعي الحديثة.
ليس من قبيل الصدفة أن يتم الإعلان عن هذا التحديث في منتدى مرجعي مثل قمة الذكاء الاصطناعي للأشعة تحت الحمراء:يتجه السوق نحو حلول أكثر قابلية للتكوين والتوسع والكفاءة، وتستجيب SiFive من خلال التكامل محركات قياسية ومتجهة ومصفوفية ضمن استراتيجية واحدة. علاوة على ذلك، تسعى الشركة إلى تقليل أوقات التصميم وتكاليفه من خلال كتل IP مترابطة جيدًا وحلول جديدة واجهات المعالج المساعد تم تحسينها لتسريع التطوير.
ما الذي يقدمه الجيل الثاني من SiFive Intelligence
في هذه الدفعة، تعمل SiFive على تحسين صيغتها من خلال الجمع بين مرونة والأداء لكل واط. تُدمج عائلة Intel Gen 2 نهجًا حوسبيًا متنوعًا يجمع بين أنوية قياسية قوية مع متجهات RVV 1.0 وفي حالة XM، محرك مصفوفة خاصة بها، وكلها باستخدام استراتيجية ذاكرة مصممة للضغط على النطاق الترددي وتقليل الاختناقات.
وتحافظ الشركة على فلسفتها التصميمية وحدات ويضيف مسارين لربط المسرع: امتداد واجهة المعالج المساعد المتجه (في سي آي إكس) وواجهة المعالج المساعد القياسي (إس إس سي آي). تسمح هذه الواجهات للمسرعات بالوصول مباشرة سجلات وحدة المعالجة المركزية، مما يؤدي إلى تبسيط البرامج وتقليل زمن الوصول وتحسين كفاءة البيانات عند دمج المعالجات المساعدة الخارجية أو المحركات المتخصصة.
وعلى خلفية التوقعات التي تشير إلى أنه وفقا لـ ديلويت، توقع نموًا 20% من أحمال عمل الذكاء الاصطناعي في جميع المجالات التكنولوجية وحتى 78% في الحوسبة الحافةخطوة SiFive منطقية جدًا. الهدف هو توفير قطع غيار جاهزة للترخيص، مما يسمح لمصنعي المعدات الأصلية وموفري الخدمات السحابية ببناء منصات الذكاء الاصطناعي نموذجية ومستقبلية.
بالإضافة إلى الأجهزة، تتخذ الشركة خطوة مهمة في النظام البيئي للبرمجيات: لتسريع وقت طرح المنتج في السوق، تعمل SiFive على إصداره كمصدر مفتوح مكتبة نواة SiFive. تُكمّل هذه المبادرة تصميم واجهات VCIX/SSCI وتهدف إلى تطوير مجموعات الذكاء الاصطناعي أسرع وأقل تكلفة.
X160 وX180 من الجيل الثاني: الكفاءة للحافة وإنترنت الأشياء
الجديد X160 الجيل الثاني (32 بت) و X180 الجيل الثاني (64 بت) مخصصة لسيناريوهات محدودة الطاقة والمساحة مثل أجهزة إنترنت الأشياء والطائرات بدون طيار y الروبوتات المستقلةإنهم يتشاركون في دعم سجل متجه 128 بت ومسار بيانات 64 بت، مما يسمح لهم بالعمل بكفاءة. تنسيقات الأرقام شائعة في الذكاء الاصطناعي مثل INT8 و BF16.
من حيث القياس، يمكن تجميع كليهما في مجموعات تصل إلى أربعة أنويةتحقيق توازن مثالي بين الأداء والاستهلاك. يتيح هذا النهج تكييف الطاقة مع كل حالة استخدام دون التضحية بـ كفاءة استخدام الطاقة أن الحافة تطالب.
إن حقيقة قيامهم بدمج متجهات 128 بت في هذا النطاق "الخفيف" تكشف عن نية SiFive: أخذ حساب الذكاء الاصطناعي مفيد حقًا إلى أجهزة الاستشعار ووحدات التحكم والروبوتات التي تعمل بالبطاريات أو الميزانيات الحرارية الضيقة، دون فرض عقوبات على التكلفة أو سطح السيليكون.
بالنسبة للتطبيقات التي تحتاج إلى معالجة الرؤية الآلية أو تصنيف الإشارة أو تحكم ذكيتقدم هذه النوى مجموعة مناسبة تمامًا من إمكانيات المتجهات مع مسار بيانات واسع (64 بت) ودعم لـ أنواع الدقة المنخفضة التي تحدث فرقا في الاستدلال.
X280 Gen 2: متجه ناضج ومُحسَّن للحافة
سلسلة X280 لقد جاء بالفعل من الجيل الأول مع اعتماد جيد جدًا في مجال الذكاء الاصطناعي والتعلم الآلي، والمراجعة X280 الجيل الثاني يضاعف على الحافة مع بنية دقيقة من 8 مراحل، انبعاث مزدوج، بالترتيب وSuperscalar. هذا النواة قادر على العمل مع أنوية متعددة ومُصمم لحوسبة الذكاء الاصطناعي/التعلم الآلي على الحافة مع امتدادات متجهية واسعة، ومصممة لـ RVV 1.0 و خاصتهم ملحقات SiFive Intelligence.
على وجه التحديد، يوفر X280 Gen 2 معالجة متجهية مع شبكة افتراضية 512 بت وشبكة DLEN ذات 256 بت، وهو تكوين يسمح بالتوازي الفعال لعمليات الرؤية والصوت والنماذج البسيطة النموذجية. يُسرّع هذا العرض المتجهي، إلى جانب الامتدادات الخاصة بـ SiFive، النوى الحرجة التي تحدد أداء التطبيقات الحقيقية.
التغيير الرئيسي الآخر هو تبسيط التسلسل الهرمي للذاكرة: تتم إزالة طبقة الذاكرة. ذاكرة التخزين المؤقت L3 لصالح أ L2 مشترك حتى 1 ميجابايت لكل مجموعة. بهذا القرار، تسعى SiFive إلى تقليل زمن الوصول والتعقيد، معتمدةً على ذاكرة تخزين مؤقتة L2 أكبر وأكثر مرونة، مما يُفيد بشكل خاص أحمال عمل الاستدلال مع مجموعات العمل المتوسطة.
على مستوى ISA، تعتمد الشحنة الجديدة RVA23، والذي يقدم دعمًا أصليًا للتنسيقات الناشئة في الذكاء الاصطناعي مثل BF16, MXFP8 y MXFP4وقد تم اختيار الأخير مؤخرًا من قبل OpenAI لتوزيع نماذج الوزن المفتوح، مما يؤكد على أهمية تقديم أنواع بيانات مضغوطة ذات دقة جيدة في الاستدلالات واسعة النطاق.
بفضل قدرتها على تعدد النواة واتجاه الحافة، فإن X280 Gen 2 يناسب الأجهزة المحمولة، بنية التحتية والسيارات، وهي المجالات التي انتصر فيها جيله الأول بالفعل. ولمن يحتاج إلى الجمع بين زمن وصول منخفض واستهلاك منخفض، فهو قاعدة متينة للغاية التطبيقات المدمجة من IA.
X390 Gen 2: عندما يكون الضغط على كل متجه أمرًا مهمًا
بالنسبة للسيناريوهات التي تتطلب المزيد من عضلات المتجهات، X390 الجيل الثاني إنه يمثل قفزة ملحوظة للأمام من X280 الأصلي: مع وجود نواة واحدة فإنه يوفر بالفعل 4 × تحسين في حساب المتجهات بفضل مضاعفة طول المتجه وإضافة وحدتي حساب ومنطق متجهتين العمل بالتوازي.
من الناحية المعمارية، فهو أيضًا تصميم 8 مراحل، انبعاث مزدوج، بالترتيب، وفائق التدرج، ولكن هنا يتم دمجهما وحدتين متجهتين مع VLEN بدقة 1024 بت وDLEN بدقة 512 بت. والنتيجة هي منصة تُسرّع العمليات المكثفة بشكل كبير في عرض المتجه، مما يفتح الباب أمام نماذج ونوى أكثر تطلبًا.
يمكن توسيع نطاق X390 Gen 2 حتى مجمعات متماسكة من 4 أنويةويمكن دمج الواجهة بشكل اختياري في سي آي إكس لربط مُسرّعات الذكاء الاصطناعي المُصممة للعملاء أو المعالجات المساعدة الأخرى بشكل وثيق. يُقلل هذا القرب من تكلفة الاتصال ويُسهّل التكامل المحركات الخارجية بدون رسوم برمجية غير ضرورية.
في تكوينات رباعية النواة، تتحدث SiFive عن الوصول حتى 1 تيرابايت/ثانية من النطاق الترددي الفعال، وهو رقم يضع X390 Gen 2 كمرشح مثالي للعمل كـ وحدة التحكم في التسارع (ACU) كمحرك ذكاء اصطناعي مستقل. يسمح هذا التنوع ببناء كل شيء بدءًا من مجموعات التسارع الهجينة إلى خطوط الأنابيب النقية الذكاء الاصطناعي على RISC-V.
ليس من قبيل المصادفة أن تصميمات X280 وX390 وجدت طريقها إلى مشاريع التكنولوجيا الكبيرة: فقد شوهدت بالفعل في تطبيقات من شركات مثل جوجل على TPUs الخاصة بهاحيث أن التناغم بين التحكم والمعالجة المسبقة/اللاحقة والتسارع الصعب هو المفتاح لأداء إنتاج.
XM Gen 2: كتلة المصفوفة التي تتناسب مع مركز البيانات
سلسلة XM الجيل الثاني يمثل "كتلة الدهون" لأحمال التدريب الخفيفة والاستدلال واسع النطاق: التكامل رباعي النواة X390 الجيل الثاني بجانب محرك حساب المصفوفة طُوِّرَ بواسطة SiFive. يُمكِّن هذا المزيج من معالجةٍ مُختلطةٍ للمتجهات والمقياسات بكفاءةٍ عاليةٍ في استهلاك الذاكرة.
يمكن لكل مجموعة XM Gen 2 تقديم حتى 64 تيرا فلوب في FP8 بتردد 2 جيجاهرتز، ومن المفترض أن يتم تجميع التصميم في تكوينات متعدد المجموعات والتي تتجاوز معًا 4 فلوبسيجعل هذا النهج المعياري من السهل إنشاء مسرعات مخصصة لـ مراكز البيانات مع أنماط استهلاك وأداء مختلفة.
وتؤكد شركة SiFive أيضًا أن XM Gen 2 قوية مُهيأة للحصول على درجة الماجستير في القانون وتحافظ الشركة على تقاليدها في الأداء لكل واط. يسمح التكامل الدقيق لمجالات الحوسبة الثلاثة (القياسي، والمتجه، والمصفوفي) باستخدام عرض النطاق الترددي للذاكرة فعالة للغاية وتقلل من نسخ البيانات المكررة والحركات.
بالنسبة للفرق التي تحتاج إلى أساس لبناء مسرعات مخصصة، يعمل XM Gen 2 كـ مخطط جاهز للترخيص: توفر كتل X390 Gen 2 توجيهًا قويًا وتحكمًا، بينما يقوم محرك المصفوفة بتوسيع نطاق الإنتاجية حيثما دعت الحاجة كثافة MAC.
واجهات VCIX وSSCI: تسريع بدون احتكاك
وصول في سي آي إكس (امتداد واجهة معالج مساعد المتجه) و إس إس سي آي (واجهة المعالج المساعد القياسي) هي إحدى نقاط التميز لهذا الجيل. تسمح كلتا الواجهتين للمسرعات والمعالجات المساعدة بالوصول مباشرةً إلى سجلات وحدة المعالجة المركزية، مما يقلل من كومة البرامج الوسيطة، ويقلل من زمن الوصول ويحسن الاستخدام العام للبرامج الوسيطة. نظام فرعي للذاكرة.
في الممارسة العملية، يترجم هذا إلى تقليل وقت اللصق وزيادة وقت الحوسبة المفيد: يمكن للفرق ربط المتجهات أو المسرعات المتخصصة دون الحاجة إلى إعادة اختراع العجلة، مع بروتوكولات مستقرة ومسار بيانات مُحسَّن. مع فتح مكتبة نواة SiFive، ينخفض الاحتكاك للوصول إلى النماذج الأولية الوظيفية بشكل كبير.
بالنسبة للأحمال التي تحتوي على مراحل المعالجة المسبقة والتخطيط والمعالجة اللاحقة (على سبيل المثال، خطوط الأنابيب الرؤية والاستدلال)، هذا الاتصال المباشر بالسجلات يُبسط التنسيق بشكل كبير. يمكن أن تُدير نوى RISC-V التدفق بدقة مع تفويض "العمل الثقيل" إلى المعالجات المساعدة التي تعمل بأقل عقوبة ممكنة.
اعتماد RVA23 ودعم التنسيقات الناشئة
تقوم SiFive بمحاذاة عناوين IP الخاصة بها مع المواصفات RVA23، مفتاح لمستقبل برمجيات RISC-V الموجهة للذكاء الاصطناعي. تُمكّن هذه الخطوة أنواع البيانات مثل BF16, MXFP8 y MXFP4، وهو أمر ذو قيمة خاصة عندما يتحرك السوق نحو دقة مختلطة وديناميكيات.
إن دعم MXFP4 ليس مجرد نزوة: لقد تم اختياره من قبل OpenAI لتوزيع نماذج الوزن المفتوح، وبالتالي فإن وجود تسارع مباشر إلى هذا التنسيق يقلل من التحويلات و اختناقات في التطبيقات الحديثة. في الاستدلال على نطاق واسع، كل دورة وكل بايت له أهميته.
التوافق مع RVV 1.0 على X280 وامتداد VLEN/DLEN على X390 يضمن أن المكتبات والمترجمات و الأطر يمكن بسهولة ضغط الأجهزة. هذا يُسرّع من اعتمادها في الأنظمة البيئية حيث تكون دورات التحقق من صحة البرامج وصيانتها هي الأكثر شيوعًا. تكلفة.
الأداء والذاكرة وقابلية التوسع العملي
الميزة الشاملة لعائلة Intelligence Gen 2 هي كيفية إدارتها عرض النطاق الترددي ونقل البيانات. إعادة تكوين ذاكرة التخزين المؤقت في X280 Gen 2 (وداعًا للمستوى الثالث، مرحبًا بذاكرة L3 مشتركة تصل إلى 2 ميجابايت) والجمع بين وحدات الحساب والمنطق ثنائية المتجهات في X390 Gen 2، يسمحون بالحفاظ على معدلات عالية دون الوقوع في التشبع المبكر.
البيانات تصل إلى 1 TB / s في أربعة تكوينات لـ X390 من الجيل الثاني، يُظهر هذا طموح التصميم بوضوح: لا يكفي وجود عدد كبير من وحدات FLOPS إذا لم تكن تعمل بكفاءة. في XM من الجيل الثاني، يُعزز تكامل المتجهات والمصفوفات وطوبولوجيا المجموعات المتعددة هذه الفكرة من خلال تقليل القفزات و نسخ وسيطة.
بالنسبة لفرق الهندسة، يترجم هذا إلى حلول قابلة للتطوير "بشكل نظيف": يمكنك البدء بـ مجموعات صغيرة لإثبات المفهوم والنمو نحو عمليات النشر متعددة المجموعات دون الحاجة إلى إعادة التفكير في بنية البيانات بأكملها و التماسك.
حالات الاستخدام: من المستشعر إلى مركز البيانات
على الحافة، يتيح X160/X180 Gen 2 تطبيق الذكاء الاصطناعي في أجهزة استشعار ذكيةالتحكم في طيران الطائرات بدون طيار والروبوتات المتنقلة، حيث تكون ميزانيات الطاقة وتكاليف الوحدات بالغة الأهمية. يُسرّع دعم INT8 وBF16، إلى جانب سجلات متجهات 128 بت، التلافيف، المرشحات ونوى الرؤية بكفاءة عالية.
خطوة للأمام، X280 Gen 2 يناسب البوابات و الأنظمة المدمجة التي تتطلب كثافة متجهات أكبر، سواءً للتحليلات الفورية، أو معالجة البيانات مسبقًا في شبكات الجيل الخامس/السادس، أو الوظائف المتقدمة في صناعة السيارات. وتركز على RVV 1.0 وتمهد ذاكرة التخزين المؤقت L2 المشتركة الطريق لأنابيب الاستدلال ذات زمن الوصول المنخفض.
في نطاق الأداء العالي، يعمل X390 Gen 2 بمثابة عقل المسرعات الخارجية (ACU) أو بشكل مباشر كمحرك متجه مستقل، مع ميزة وجود مسار واضح لإضافة المعالجات المساعدة عبر في سي آي إكسوهذا يجعل من الأسهل إعداد حلول هجينة حيث يتعايش التحكم والحوسبة الثقيلة بطريقة أكثر فعالية. فعال.
أخيرًا، يضع XM Gen 2 الكريمة على الكعكة للأحمال واسعة النطاق حيث TFLOPS لكل واط وسهولة التوسع. ولأنه مُعدّل بدقة لبرامج ماجستير إدارة الأعمال، فهو جذاب بشكل خاص لاستنتاج النماذج الكبيرة ولمراحل معينة من تدريب خفيف أو الضبط الدقيق في مراكز البيانات.
التوفر وخريطة الطريق
وقد أكدت شركة SiFive أن جميع هذه عناوين IP هي المتاحة بالفعل للترخيص، مما يسمح للشركاء ببدء عملية التكامل فورًا. وفيما يتعلق بالمنتجات التجارية، من المتوقع طرح أولى الرقائق القائمة على هذه الملكية الفكرية في شنومك الربع الثاني، أفق معقول للتصاميم المعقدة مع الشهادات والتحقق الشامل.
تتناسب هذه النافذة الزمنية مع الطلب المتزايد المتوقع على الحافة و مركز البيانات، ويمنح الفرق مساحة لتنمية مجموعات البرامج الخاصة بهم من خلال البناء على مكتبة نواة SiFive وفي توحيد معايير الواجهات التي تقترحها العلامة التجارية.
ملخص المواصفات والميزات الرئيسية
لوضع كل قطعة في مكانها، يجدر بنا تذكر أبرز نقاط تميز هذه العائلة. صُممت X160/X180 Gen 2 خصيصًا لـ انخفاض الاستهلاك مع توجيه معتدل؛ يعزز X280 Gen 2 الحافة باستخدام RVV 1.0 وL2 المشتركة؛ يعزز X390 Gen 2 عرض المتجه و التوازيويضيف XM Gen 2 محرك المصفوفة الخاص به المصمم لـ LLMs وتوسيع نطاق المجموعات المتعددة.
- X160/X180 الجيل الثاني: 32/64 بت، سجلات متجهة 128 بت، مسار بيانات 64 بت، دعم INT8 وBF16، مجموعات من 4، التركيز على إنترنت الأشياء/الروبوتات مع كفاءة الحد الأقصى.
- X280 الجيل الثاني: 8 مراحل، إصدار مزدوج، بالترتيب، فائق القياس؛ VLEN 512/DLEN 256؛ RVV 1.0 + SiFive Intelligence Extensions؛ التسلسل الهرمي مع L2 مشترك ما يصل إلى 1 ميجابايت لكل مجموعة.
- X390 الجيل الثاني: 8 مراحل، إصدار مزدوج، بالترتيب، فائق التدرج؛ وحدة حسابية منطقية مزدوجة المتجهات؛ VLEN 1024/DLEN 512؛ قابلة للتطوير إلى 4 نوى متماسكة؛ VCIX اختياري؛ ما يصل إلى 1 تيرابايت/ثانية في تكوين رباعي النواة.
- XM الجيل الثاني: 4 × محرك مصفوفة X390 Gen 2 + SiFive؛ ما يصل إلى 64 TFLOPS FP8 بسرعة 2 جيجاهرتز لكل مجموعة؛ قابلة للتطوير فوق 4 فلوبس في مجموعات متعددة؛ مضبوطة بشكل كبير على LLMs والأداء العالي لكل واط.
لماذا هذا الأمر مهم الآن: البرمجيات والمعايير والنظام البيئي
تكون إعلانات الأجهزة ذات صلة عندما تكون مصحوبة بـ برنامج قوي ومعاييرها. اعتماد RVA23، والدعم الصريح لتنسيقات مثل MXFP8/MXFP4/BF16، وإصدار مكتبة نواة SiFive إنهم يدعمون الاقتراح حتى تتمكن المكتبات والأطر من الاستفادة منه دون احتكاك.
إن الالتزام بالواجهات الواضحة (VCIX وSSCI) يقلل أيضًا من "عامل الخطر" لأولئك الذين يخططون للتكامل مسرعات خاصةفي عصر يتم فيه التحكم في التمايز من خلال نوى محددة ونماذج خاصة، فإن وجود مسار نظيف للسجلات و مسارات البيانات انخفاض زمن الوصول يحدث الفارق.
يضاف إلى الجذب المسبق في القطاعات كما السياراتوالبنية التحتية والهواتف المحمولة، بعد أن دخلت بالفعل في النظام البيئي للشركات الكبيرة مثل Googleيرسل SiFive إشارة مفادها أن RISC‑V لم يعد مجرد بديل، بل أصبح منصة ناضجة لأحمال العمل الذكاء الاصطناعي الإنتاجي.
كل هذا، بالإضافة إلى ذلك، يأتي عندما يسعى الموردون إلى تحقيق الاستقلال التكنولوجي والتكاليف المستدامة والمرونة الترخيصتتناسب الوصفة المعيارية لـ Intelligence Gen 2 مع الرغبة في بناء ما هو مطلوب بالضبط، لا أكثر ولا أقل، وتوسيع نطاقه عندما تحتاج إليه الشركة. تطلب.
على الرغم من أن كل حالة استخدام سيكون لها مخطط كتلي خاص بها، فإن الاتساق في التصميم بين X160/X180 وX280 وX390 وXM يسمح بدمج الأجزاء دون "مفاجآت" وبمسار واضح للتحسين. الأداء/الاستهلاكيفتح هذا الاتساق الباب أمام دورات تطوير أقصر وإعادة عمل أقل.
عند النظر إليها ككل، تغطي عائلة Intelligence Gen 2 النطاق بأكمله بسهولة: من مدخل بطاقة الذاكرة : نعم يتطلب الذكاء الاصطناعي الأساسي حتى الرف الذي يتطلب PFLOPS قابلة للتطوير، ويمر عبر بوابات ووحدات تحكم تنظم مسرعات خارجيًا. وهذه خطوة تتوافق مع اتجاه الصناعة نحو البنيات غير المتجانسة والقابلة للتكوين.
بالنسبة لأي شخص يتطلع إلى بناء منصة ذكاء اصطناعي حديثة، هناك عناصر بناء هنا تجمع بين متجه ناضج، وحوسبة مصفوفية قوية، ونظام برمجيات لا يبدأ من الصفر. أضف إلى ذلك الدفعة القوية من المعايير الناشئة وتوقعات النمو في الحوسبة الطرفية، وتوافق العناصر أمرٌ رائع. إحساس.
تقدم SiFive أجهزة RISC‑V AI التي تبدو عملية ومدروسة جيدًا: شكلي حيث ينبغي أن يكون، فعّالاً فيما يتعلق به، ومع جسرٍ متينٍ للبرمجيات. مع توفر التراخيص بالفعل، والتخطيط لأولى تطبيقات السيليكون في عام ٢٠٢٦، يُعدّ هذا الاقتراح قابلاً لبناء منصات اليوم لـ صباح.

