رئيس الذكاء الاصطناعي في شركة AMD ينتقد أداة الترميز الخاصة بشركة أنثروبيك بعد شهور من الإحباط، قائلاً إن كلاود لا يمكن الوثوق به لأداء المهام الهندسية المعقدة

مدير الذكاء الاصطناعي في AMD يكشف تراجع أداء نموذج Claude Code بعد تحديث فبراير 2026

حذر مدير الذكاء الاصطناعي في شركة AMD، ستيللا لورينزو، من تدهور أداء نموذج Claude Code منذ فبراير 2026، مؤكداً أنه لم يعد يُعتمد عليه في أداء المهام الهندسية المعقدة. يأتي هذا التحذير بعد تحليل شامل لأكثر من 6800 جلسة برمجة، وقرابة 235,000 استدعاء لأدوات، و18,000 عملية تفكير، حيث لوحظت تكرارات مقلقة لسلوكيات غير موثوقة.

تدهور أداء Claude Code بعد التحديث الأخير

وفقًا للورينزو، فإن النموذج أصبح أقل فاعلية منذ بداية عام 2026، حيث أظهرت البيانات أن العديد من المهندسين الكبار على فريقها أبلغوا عن تجارب مماثلة. وأشارت إلى أن حالات الانسحاب المبكر من المهام، أو ما يُعرف بـ“انتهاكات وقف التنفيذ” (stop-hook violations)، زادت بشكل ملحوظ، من صفر في بداية مارس إلى حوالي 10 حالات يوميًا بعد ذلك.

تأثير التحديثات على سلوك النموذج

في منشور على منصة GitHub، أشار المستخدم Stellar Laurenzo، المعروف باسم Stellaraccident، إلى وجود ارتباط قوي بين إدخال ميزة “حجب التفكير” (redact-thinking-2026-02-12) وتراجع الأداء في المهام المعقدة. حيث تعتبر القدرة على التفكير العميق من أهم العوامل لنجاح النماذج في المهام الهندسية المتقدمة.

تغييرات في سلوك النموذج وأدائه

لاحظت لورينزو تحولًا من سلوك يركز على البحث والتفكير الأولي إلى نمط يعتمد على التعديلات السريعة، مما أدى إلى إنتاج كود أقل جودة، وضعف الالتزام بالمعايير، وانخفاض الاعتمادية خلال الجلسات الطويلة.

رد شركة أنثروبيك وتفسيرها للتغييرات

ردت شركة أنثروبيك على الانتقادات عبر توضيح أن إعداد “حجب التفكير” لا يقلل فعليًا من مستوى التفكير، حيث يقتصر دوره على إخفاء عمليات التفكير من واجهة المستخدم فقط. وأطلقت الشركة تحديثًا جديدًا، Opus 4.6، أتاح ميزة التفكير التكيفي التي تسمح للنموذج بتحديد الوقت المثالي للتفكير بشكل ديناميكي، بهدف تحسين الأداء والكفاءة.

تحسينات قادمة لفرق المؤسسات

أوضح Boris، أحد مسؤولي أنثروبيك، أن بعض المستخدمين يفضلون أن يفكر النموذج لفترة أطول حتى لو استغرق ذلك وقتًا إضافيًا واستخدامًا أكبر للرموز. ولذا، يمكن للمستخدمين الآن زيادة مستوى الجهد إلى “عالي” عبر إعدادات /effort أو ملف settings.json، مع وعد بتوفير فرص لاختبار جهود أعلى لمجموعات Teams و Enterprises، لتمكينهم من الاستفادة من التفكير الممتد رغم زيادة الاستهلاك في الوقت والرموز.

تقييم وتحليل الأداء المستقبلي

عبّر Boris عن تقديره للجهود المبذولة في التحليل، مشيدًا بعمل لورينزو في AMD، معتبرًا أن التقييم الدقيق هو خطوة مهمة نحو تحسين أداء النماذج في المستقبل.


تابع TechRadar على Google News للبقاء على اطلاع بأحدث الأخبار والتقارير والتحليلات التي تحتاجها شركتك، ولا تنسَ الضغط على زر “متابعة” للاستفادة من محتوى موثوق ومتميز.

ولمحبي الفيديو، يمكنكم متابعة TechRadar على TikTok لمراجعات الأخبار والتقارير بشكل مرئي، بالإضافة إلى التحديثات المنتظمة عبر WhatsApp.


📌 هذا المقال تم إعادة تحريره باستخدام الذكاء الاصطناعي مع الحفاظ على المصدر الأصلي.
0 0 0 0 0 0
0 تعليقات
تعليق

منشورات أخرى

جاري تحميل المنشورات…