شركة إنتل وسامبانوفا أنشأتا للتو آلة ذكاء اصطناعي مكونة من ثلاثة شرائح تقوم بتقسيم العمل بين وحدات معالجة الرسوميات (GPU)، ووحدات معالجة البيانات (RDU)، ومعالجات إنتل زيون (Xeon).

تقنية جديدة تجمع بين وحدات معالجة الرسوميات والذكاء الاصطناعي عالية الأداء لتعزيز قدرات الاستدلال الضخم

تتجه صناعة الذكاء الاصطناعي نحو اعتماد بنية هجينة تجمع بين أحدث وحدات معالجة الرسوميات (GPUs) ووحدات الرقاقة الخاصة بالتعلم الآلي، بهدف تحسين أداء الاستدلال الضخم وتقليل زمن الاستجابة. إذ أعلنت شركتا SambaNova Systems وIntel عن تصميم مشترك يجمع بين وحدات معالجة الرسوميات، ووحدات الرقاقة الخاصة بـ SambaNova، ومعالجات Intel Xeon 6، لإنشاء نظام متطور يهدف إلى التعامل مع أحمال العمل الضخمة في بيئات الذكاء الاصطناعي.

نظام متكامل لأداء فائق في الاستدلال الضخم

يُخصص النظام وحدات معالجة الرسوميات (GPUs) لمهام التمهيد أو prefill operations، حيث تقوم بتحويل المطالبات إلى مخازن من المفاتيح والقيم. بينما تتولى وحدات SambaNova RDUs مهمة الترميز أو decoding، حيث تنتج الرموز بسرعة عالية مع استهلاك منخفض للزمن وتأخير منخفض. أما معالجات Intel Xeon 6، فهي تتولى إدارة توزيع الأحمال، وتنفيذ الشفرات، وتنسيق العمليات عبر بيئات تعتمد على الوكلاء أو agents.

“الذكاء الاصطناعي الوكولي يتجه نحو الإنتاج — والنموذج الناجح الذي نراه هو أن تبدأ وحدات المعالجة الرسومية المهمة، تليها معالجات Xeon 6 لتنفيذها، وتنتهي بـ SambaNova RDUs لإنهائها بسرعة عالية”، قال رودريغو ليانغ، الرئيس التنفيذي والمؤسس المشارك لشركة SambaNova Systems.

مركزية المعالجات وتوزيع المهام

يُعد معالج Intel Xeon 6 جزءًا أساسيًا من بنية النظام، حيث يتولى التحكم وإدارة توزيع الأحمال، بالإضافة إلى تنفيذ الكود والتحكم في تفاعلات الأدوات. يشمل ذلك عمليات الترجمة، والتحقق من النتائج، والحفاظ على التواصل بين العمليات المتزامنة.

“عندما يكون هناك آلاف الوكلاء الذين يجرون استدعاءات للأدوات، وطلبات استرجاع البيانات، وبناء الرموز، وإرسال رسائل مشفرة بين الوكلاء، فإن المعالج هو القلب التنفيذي والنشط للنظام”، قال هاري أولت، المدير التجاري لشركة SambaNova.

وتؤكد الشركة أن معالج Xeon 6 يُقدم أداءً أسرع بنسبة أكثر من 50% في زمن ترجمة LLVM مقارنة بمعالجات السيرفر المعتمدة على معمارية ARM، كما يوفر أداءً أعلى بنسبة تصل إلى 70% في قواعد البيانات المتجهة مقارنة بأنظمة x86 الأخرى.

مميزات الأداء والتوافق

تُركز البنية على سرعة التنفيذ داخل سير العمل، حيث تتولى وحدات معالجة الرسوميات مرحلة التمهيد، وتقوم RDUs بمعالجة الترميز، بينما يدير معالج Xeon 6 العمليات على مستوى النظام ويشغل الأحمال المترجمة.

“الاستدلال في الإنتاج يتجه نحو الأجهزة المختلطة — لا يوجد نوع واحد من الشرائح مثالي لكل مرحلة من مراحل سير العمل الوكولي”، قال بانغها تشو، المؤسس المشارك ومدير التقنية في RadixArk.

كما أن النظام مصمم للعمل داخل مراكز البيانات المبردة بالهواء الحالية، دون الحاجة إلى بنية تحتية جديدة، مما يسمح بتوسيع الأحمال دون استهلاك إضافي للمياه والطاقة. ومع استمرار تركيز Nvidia وGroq على تحسين سرعة الاستدلال وتقليل زمن الانتظار، فإن هذا الإعلان يمثل بديلًا تنافسيًا يوزع الأحمال عبر طبقات متعددة من الأجهزة بدلاً من الاعتماد على نوع واحد فقط.

التطلعات المستقبلية

تُتوقع أن يتوفر هذا النظام بحلول النصف الثاني من عام 2026، موجهًا للشركات، ومزودي الخدمات السحابية، والبيئات السيادية، مما يعزز قدرات الاستدلال الضخم بطريقة أكثر كفاءة ومرونة.

تابعوا أخبار التقنية والتحليلات عبر TechRadar على Google News، وكونوا على اطلاع دائم على أحدث التطورات في عالم الذكاء الاصطناعي والتكنولوجيا المتقدمة!


📌 هذا المقال تم إعادة تحريره باستخدام الذكاء الاصطناعي مع الحفاظ على المصدر الأصلي.
0 0 0 0 0 0
0 تعليقات
تعليق

منشورات أخرى

جاري تحميل المنشورات…