في سوق مليء بمكبرات الصوت الذكية المغلقة، ظهر أخيرًا بديل يضع التحكم في أيدي المستخدم: مساعد الذكاء الاصطناعي الذي يفهم نفسه ويصلح نفسه. هكذا يتم تقديم Ubo Pod Developer Edition (DE)، وهو جهاز مفتوح المصدر على Raspberry Pi 4 أو 5 يجمع بين الصوت والرؤية الحاسوبية وأجهزة الاستشعار في هيكل معياري لا يتطلب خدمات خاصة للعمل.
الفكرة لا تقتصر على السؤال عن الطقس أو تشغيل الموسيقى. يجمع جهاز Ubo Pod بين الميكروفونات ومكبرات الصوت وشاشة ملونة وكاميرا وأجهزة استشعار بيئية ونظام الأشعة تحت الحمراء (الباعث والمستقبل). للتحدث مع نماذج اللغة، وتفسير ما تراه، وحتى التحكم في معدات غرفة المعيشة صوتيًا. أنت تختار بين استخدام الذكاء الاصطناعي السحابي أو جعل كل شيء يتم محليًا، مع إعطاء الأولوية للخصوصية. وإذا كنت ترغب في إجراء تعديلات، فإن البيئة مصممة لتجربة الصوت والرؤية والأدوات دون الحاجة إلى مواجهة النظام الأساسي.
ما هو Ubo Pod Developer Edition وما هو غرضه؟
إصدار المطور هو جوهر المشروع. طموحهم هو استبدال "الصناديق السوداء" مثل Echo أو Nest بمساعد قابل للبناء والتدقيق باستخدام الأجهزة المفتوحة والبرمجيات المجانيةتحرر من قيود الخدمات المغلقة. باستخدام نفس المعدات، يمكنك تفعيل التعرف التلقائي على الكلام (STT)، وتركيب الكلام (TTS)، ونماذج اللغة والرؤية (LLMs/VLMs)، واستدعاء الأدوات، ومحفزات التنشيط لسيناريوهات مختلفة.
والجميل في الأمر هو أنه لا يتطلب البرمجة. ويحتوي على واجهة رسومية على شاشته المدمجة وواجهة مستخدم ويب لتكوينه دون الحاجة إلى لمس الكود.حتى تتمكن من اختيار موفري الذكاء الاصطناعي، وضبط الخيارات، وتفعيل الميزات مباشرة من جهازك أو متصفحك.
يمتد الافتتاح عبر التصميم بأكمله. يتم إصدار كل من تطبيق Ubo والأجهزة بموجب تراخيص مفتوحة ومستودعات عامةبما في ذلك لوحات الدوائر والملفات الميكانيكية. إذا كنت ترغب في التدقيق أو التعديل أو المساهمة، فالنظام "واضح للعيان"، وهو أمر غير شائع في هذا النوع من المساعدين المنزليين.
التصميم والأجهزة: معيارية وقابلة للتوسيع والإصلاح
الهيكل مدمج ومصمم ليدوم طويلاً. تبلغ أبعاده 130 × 99 × 52 ملم، ويزن حوالي 340 جرامًا، وهو مصمم لاستيعاب Raspberry Pi 4 أو Raspberry Pi 5.مع إدارة حرارية نشطة للحفاظ على أداء مستقر أثناء الجلسات الطويلة.
يحتوي الجزء الأمامي على شاشة IPS ملونة مقاس 1,54 بوصة بدقة 240 × 240 بكسل. على الرغم من أنها ليست كبيرة الحجم، إلا أنها تسمح لك بعرض الحالات والقوائم وواجهة مستخدم رسومية صغيرة متكاملة. لإجراء التعديلات أو استشارة المعلومات على الفور، دون الحاجة للذهاب إلى الكمبيوتر.
بجوارها مباشرة توجد كاميرا بدقة 5 ميجا بكسل توفر مدخلات الرؤية الحاسوبية. يمكن لمتغير Ubo Pro 4 استخدام كاميرات Raspberry Pi V1 و V2 الرسميةبالإضافة إلى ذلك، يضيف Ubo Pro 5 التوافق مع وحدة الكاميرا 3، مما يؤدي إلى توسيع خيارات الالتقاط والتركيز.
تم تصميم قسم الصوت لإجراء محادثات طبيعية. تتميز بميكروفونات ستيريو مزدوجة مع التقاط يصل إلى 48 كيلو هرتز ومكبرات صوت ستيريو مع تشغيل يصل إلى 48 كيلوهرتز مع تشويه منخفض جدًا (<0,1% THD). تشير الوثائق إلى 1 واط لكل قناة و2 واط لكل مكبر صوت؛ على أي حال، صُمم النظام لتوفير صوت نقي في بيئة سطح المكتب أو غرفة المعيشة.
إذا كنت تفضل إرسال الصوت إلى معدات أخرى، فهناك مخرج خط يعتمد على برنامج الترميز WM8960. يقوم بتوصيل 40 مللي واط إلى 16 أوم، ويكتشف إدخال المقبس، ويعلن عن THD بقيمة -75 ديسيبل عند 20 مللي واط، ويحقق 90 ديسيبل نسبة إشارة إلى ضوضاء مع حمل 16 أوم.يوفر هذا المرونة لأشرطة الصوت أو مكبرات الصوت أو مكبرات الصوت النشطة.
للتحكم المادي بالمعدات، تحتوي اللوحة الأمامية على لوحة مفاتيح صغيرة. يوجد 7 أزرار سيليكون ناعمة الملمس وزر طاقة مخصص.، ما يكفي للتعامل مع القوائم أو الحصول على اختصارات للوظائف.
ويتم تعزيز الجزء "البصري" بحلقة من الضوء. يحتوي على 27 مصباح LED RGB قابل للعنونة (SK6812، متوافق مع NeoPixel)مثالي لعرض الحالات أو الرسوم المتحركة أو التعليقات أثناء المحادثات.
من حيث الاتصال، فإنه يرث أفضل ميزات Raspberry Pi. إنه يوفر Gigabit Ethernet، وWiFi 5، وBluetooth 5.0، ومنفذين USB 3.0، ومنفذين USB 2.0. من SBC نفسها، مع وجود مساحة كبيرة للأجهزة الطرفية الخارجية أو المعجلات.
ومن بين المميزات المميزة للمنزل هي الأشعة تحت الحمراء. يتضمن جهاز استقبال الأشعة تحت الحمراء بمدى يصل إلى 5 أمتار (TSOP75238) وأربعة أجهزة إرسال الأشعة تحت الحمراء عالية الطاقة 940 نانومتر (VSMB10940) مع نمط متعدد الاتجاهات تقريبًا، مما يسمح له بتعلم الأوامر وإرسالها إلى أجهزة التلفزيون أو أشرطة الصوت أو مكيفات الهواء.
وتأتي أجهزة الاستشعار البيئية مجهزة بالكامل بشكل قياسي. يشتمل على مستشعر درجة الحرارة PCT2075 (دقة ±1 درجة مئوية بين -25 درجة مئوية و+100 درجة مئوية) ومستشعر الضوء المحيط VEML7700، قادرة على القياس من 0 إلى 120 كيلو لوكس بدقة عالية تبلغ 0,0036 لوكس/قيراط.
من حيث التخزين، تتضمن الحزمة الأساسية البطاقة الجاهزة للتشغيل. تم تضمين بطاقة microSD بسعة 32 جيجابايت مثبتة مسبقًا مع نظام التشغيل.حتى تتمكن من البدء في استخدامه بمجرد تشغيله.
إذا قمت بالقفزة إلى النموذج الأعلى، فستحصل على مكافأة. يضيف Ubo Pro 5 فتحة M.2 PCIe لمحركات أقراص NVMe SSD أو لتركيب مسرع الذكاء الاصطناعي.يعد هذا مفيدًا جدًا لتشغيل النماذج المحلية المتطلبة أو تخزين الذكريات وقواعد المعرفة دون القلق بشأن المساحة.
- شاشة IPS مقاس 1,54 بوصة (240×240) للواجهة المضمنة والحالات
- كاميرا بدقة 5 ميجابكسل ودعم كاميرا Raspberry Pi الرسمي (حسب الطراز)
- ميكروفون مزدوج + مكبرات صوت ستيريو مُحسَّن للصوت
- الأشعة تحت الحمراء RX/TX للتحكم الشامل في غرفة المعيشة
- أجهزة استشعار درجة الحرارة والضوء بدقة ونطاق واسع
الخصوصية الملموسة والتحكم في البيانات
وراء النوايا، هناك تدابير مادية. يمكن تغطية الكاميرا بستارة خصوصية. لذا، فهو صامت عند عدم الحاجة إليه. وتحتوي الميكروفونات على مفتاح كتم صوت مدمج، ما يسمح لك بكتم الصوت دون الاعتماد كليًا على البرنامج.
ويدعم هندسة البرمجيات هذه الفلسفة. يمكنك العمل محليًا بالكامل أو الاعتماد على الخدمات السحابية.ضبط التوازن بين الراحة والخصوصية بما يتناسب مع كل حالة. إذا كنت لا ترغب في نقل الصوت أو الصور من شبكتك، يمكنك ضبطها للعمل محليًا.
برمجيات مفتوحة المصدر، وواجهة مستخدم ويب، والتوافق مع أكثر من 50 مزودًا للذكاء الاصطناعي
يعمل النظام الأساسي على نظام التشغيل Raspberry Pi وتطبيق Ubo. تم كتابة التطبيق بلغة Python وتم نشره على GitHub.لذلك، لا تحتاج إلى شراء الجهاز لتجربته: يمكنك تثبيته على Raspberry Pi 4 أو 5 الذي تمتلكه بالفعل.
توافق الخدمة واسع ومتنوع. يدعم Ubo Pod أكثر من 50 بائعًا للتعرف على الكلام، وتحويل النص إلى كلام، والذاكرة، والرؤية، وLLMs، مع خيارات سحابية ومحلية/محلية يمكن تحديدها من الشاشة أو واجهة الويب.
إذا كنت تفضل أن تقرر كل نموذج بنفسك، فيمكنك القيام بذلك أيضًا. من الممكن استهداف نقاط نهاية واجهات برمجة التطبيقات الشائعة مثل Gemini أو ChatGPT أو Claude.أو استخدم Ollama لتشغيل برامج إدارة التعلم محليًا، مما يقلل من زمن الوصول ويحافظ على البيانات داخل الشركة.
لتوسيع القدرات دون تعقيد الأمور، هناك واجهة برمجة تطبيقات مصممة للمطورين. يعرض النظام واجهة برمجة تطبيقات gRPC التي تسمح لك بإنشاء وحدات أو تكاملات باستخدام بضعة أسطر فقط من التعليمات البرمجية.، مما يجعل من الأسهل إضافة الميزات المخصصة لكل مشروع.
لا تتوقف طبقة المحادثة عند الرد بالنص. دعم استدعاء الأدوات وآليات التنشيط المختلفة إنها تسمح لك بتسلسل الإجراءات، وقراءة المستشعرات، وعرض البيانات على الشاشة، أو إضاءة حلقة LED اعتمادًا على الحالة.
الرؤية الحاسوبية والأشعة تحت الحمراء: المنزل تحت صوتك
تتيح الكاميرا المتكاملة ودعم الوحدات الرسمية للجهاز "الرؤية". يمكنه التعرف على الرموز والأحرف والإيماءات والأشياءفتح الباب أمام السيناريوهات مثل قراءة رمز على الشاشة، أو اكتشاف إشارة تأكيد، أو وصف مشهد لإعطائك السياق.
يعد التحكم بالأشعة تحت الحمراء الشامل حليفًا رائعًا آخر للحياة اليومية. يمكنك تعليمه الأوامر من جهاز التحكم عن بعد المفضل لديك حتى يتمكن من إعادة إنتاجها. أو اطلب منه مباشرة عن طريق الصوت إرسال إشارات إلى التلفزيون أو مكبر الصوت أو مكيف الهواء.
سهل الاستخدام... وجاهز للتلاعب به
على الرغم من أن DE مخصصة للملفات الشخصية الفنية، إلا أنها لا تتطلب منك البرمجة. يبدأ العمل بشكل وظيفي ويمكنك تكوينه ببساطة من واجهة المستخدم على الويب لا داعي لكتابة أي شيفرة برمجية إذا لم تكن ترغب في ذلك. قم بتوصيله، وعدّل بعض الأمور، وسيعمل.
إذا كنت ترغب في رفع غطاء المحرك، فإن التضاريس مثالية. تتيح لك الأجهزة المعيارية والبرامج المفتوحة تغيير الأجزاء وإضافة وحدة تخزين M.2 في Pro 5 أو جرّب مُسرّعات الذكاء الاصطناعي. وإذا لم تُرِد تعقيد الأمور، فالتزم بما هو متاح.
النماذج والمواصفات الرئيسية والاختلافات
تدور العائلة حول Raspberry Pi 4 أو 5، مع وجود نسختين رئيسيتين. يتشارك كل من Ubo Pro 4 وUbo Pro 5 في نفس القاعدة (شاشة IPS مقاس 1,54 بوصة بدقة 240×240، وكاميرا بدقة 5 ميجابكسل، وميكروفون مزدوج ومكبر صوت، وأجهزة استشعار بالأشعة تحت الحمراء، وحلقة LED، ولوحة مفاتيح مكونة من 7 أزرار)لكنهم يختلفون في بعض النقاط.
- الكاميرات الرسميةيدعم Pro 4 وحدات Raspberry Pi V1 وV2؛ ويضيف Pro 5 دعمًا لوحدة الكاميرا 3.
- التخزين والتسريعيتضمن Pro 5 فتحة M.2 PCIe لمحركات أقراص NVMe SSD أو مسرعات الذكاء الاصطناعي.
- الاتصال:كلاهما يرث Gigabit Ethernet، وWiFi 5، وBluetooth 5.0، و2×USB 3.0، و2×USB 2.0.
- Audioمكبرات صوت ستيريو WM8960 ومخرج خط مع اكتشاف المقبس.
- نظام:تم تثبيت بطاقة microSD بسعة 32 جيجابايت مسبقًا لسهولة التمهيد.
الأسعار والتوافر وحقائق التمويل الجماعي
المشروع موجود على Kickstarter بهدف تمويله بمبلغ 25.000 دولار. تبدأ المكافآت من 109 دولارًا أمريكيًا لجهاز Ubo Pro 4 و129 دولارًا أمريكيًا لجهاز Ubo Pro 5يرجى ملاحظة أن أيًا منها لا يتضمن Raspberry Pi في الصندوق، والشحن منفصل.
كما هو الحال دائمًا مع التمويل الجماعي، فمن الحكمة أن نكون حذرين. الدعم ليس مثل الشراء: دعم المشروع لا يضمن التسليمقم بمراجعة المعلومات، ووزن المخاطر، ثم قرر مدى أهمية المشاركة.
يمكنكم الاطلاع على الحملة على الموقع الرسمي. أدخل في حملة Ubo Pod على موقع Kickstarter لرؤية التفاصيل والمستويات والمواعيد النهائية قبل المشاركة.
حالة المشروع ورسالة من المنشئ
وبحسب الجهة المنظمة للحملة، فقد اقتربت الحملة بالفعل من 40% من الهدف بعد يومين من إطلاقها. ويطلب دفعة أخيرة ويشكر الجميع على مشاركة الأخبار.وخاصة بين الملفات الشخصية التقنية المتحمسة لمساعد مفتوح وقابل للاختراق.
هناك تفاصيل غير عادية في الحملات مثل هذه: تم تصنيع دفعة صغيرة مسبقًا وهناك بعض المخزون جاهز للشحن إلى الداعمين الأوائل.، مما يعكس سنوات العمل في مجال الأجهزة والبرمجيات وراء الاقتراح.
هدف الخالق واضح تماما. تمكين المطورين من بناء تجارب صوتية وبصرية واستشعارية سلسةوالتصدي للأنظمة المغلقة التي، في رأيهم، لا تحترم المستهلك أو حقه في الإصلاح أو اختيار الخدمات بشكل كافٍ.
من حيث الرؤية، يطلب الفريق أفكارًا. إنهم على دراية بوكالات التسويق المدفوعة، ولكنهم يركزون في الوقت الحالي على المجتمع والتسويق الشفهي.السعي لتحقيق المزيد من النمو العضوي.
الإعداد وسير العمل (دون تحويله إلى برنامج تعليمي)
تم تصميم الجهاز ليصبح مفيدًا من الصفر في وقت قصير. ترشدك واجهة الويب في اختيار موفري الذكاء الاصطناعي (الصوت والنص والرؤية والذاكرة) وفي التكوين الأساسي، تسمح لك واجهة المستخدم الرسومية للشاشة بإجراء تعديلات سريعة دون مغادرة الكمبيوتر.
إذا كنت تريد تجربته قبل الاستثمار في الأجهزة، فلا مشكلة. يمكن تثبيت تطبيق Ubo على Raspberry Pi 4 أو 5حتى تتمكن من التحقق من التوافق والأداء وما إذا كان النظام البيئي يناسبك.
بالنسبة للسيناريوهات التي تتطلب أقصى قدر من الخصوصية، هناك مجال للمناورة. يمكنك اختيار خيارات محلية أو محلية حتى لا يغادر الصوت والفيديو شبكتكوإذا كنت بحاجة إلى طاقة إضافية أو نماذج أعمال محددة، فإن مزودي الخدمات السحابية في متناول يدك، كما يمكنك الإشارة إلى واجهات برمجة التطبيقات مثل Gemini أو ChatGPT أو Claude.
دراسات الحالة والعروض التوضيحية المتاحة
وهناك بالفعل أمثلة واقعية تظهر ما يمكن أن تفعله. يحافظ تطبيق Memo، وهو مساعد الملاحظات الصوتية، على الذاكرة والسياق في المحادثة، مثالي لالتقاط التذكيرات أو الأفكار دون فقدان المسار.
في الرؤية، الأمر يتجاوز مجرد "الرؤية". يمكنك إنشاء صور من الأوامر الصوتية ووصف الصور باستخدام VLMs، مع نتائج تعتمد على النماذج والموردين المختارين، ولكن مع توفر البنية التحتية.
بالنسبة لغرفة المعيشة، يضيء الأشعة تحت الحمراء بشكل ساطع. ومن المقبول تمامًا أن تطلب منهم تغيير القناة، أو رفع مستوى الصوت، أو إيقاف تشغيل التلفزيون.بشرط أن يستقبل جهازك أوامر الأشعة تحت الحمراء. وبدمجه مع مستشعرات الضوء والحرارة، يسهل إنشاء أتمتة سياقية بسيطة.
أسباب اختيار مساعد مفتوح
المساعدين المرفقين مريحون للغاية، ولكن لديهم رسوم. مع Ubo Pod، يمكنك تحديد الخدمات التي تستخدمها، والمكان الذي تتم فيه معالجة بياناتك، ويمكنك فحص الكود.، وهو ما يشكل بالنسبة للعديد من الأشخاص الفارق بين استخدام الأداة أو "استخدامها" من قبلها.
علاوة على ذلك، لا يتم لحام الأجهزة على لوحة خاصة. من خلال الاعتماد على Raspberry Pi، من الممكن ترقية المكونات أو إصلاحها أو إعادة استخدامهايعد هذا أمرًا قيمًا عندما يكون التقادم المخطط له وشيكًا وترغب في إطالة عمر أجهزتك.
القيود والفروق الدقيقة التي ينبغي مراعاتها
ليس كل شيء مثاليًا، ومن المهم أن ندرك ذلك. لا تتضمن المكافأة Raspberry Piلذا، عليك مراعاة تكلفتها وتوفرها عند الشراء. وفي مجال الصوت، ستجد أرقامًا مثل ١ واط لكل قناة و٢ واط لكل سماعة؛ إذا كان الحد الأقصى للصوت أمرًا بالغ الأهمية، فمن الأفضل مراعاة السياق (سطح مكتب أو غرفة صغيرة) أو استخدام مخرج خطي مع سماعات خارجية.
إنه مشروع حي يتطور. تعتمد قائمة البائعين والميزات والأداء المحلي على المجتمع والتبعيات وما إذا كنت تقوم ببناء Pi 4 أو 5.الجانب الإيجابي هو أنه بكونك منفتحًا، يمكنك دائمًا التكيف والتحسن بمرور الوقت.
إنه بديل يوفر إمكانيات التحكم والخصوصية والتخصيص دون التضحية بالفائدة. مساعد الذكاء الاصطناعي مع الرؤية وأجهزة الاستشعار والأشعة تحت الحمراء، والأجهزة المعيارية والتوافق مع أكثر من 50 خدمة والتي تأتي من خلال التمويل الجماعي بأسعار دخول معقولة ونهج مفتوح جذريًا.