رحلة كلود إلى الحماقة في الرسوم البيانية: ثمن التوفير، أو كيف ارتفعت فاتورة واجهة برمجة التطبيقات 100 ضعف

By: blockbeats|2026/04/13 19:04:34

قبل بضعة أيام، نشرت ستيلا لورينزو، رئيسة قسم الذكاء الاصطناعي في شركة AMD، مشكلة بعنوان "كود كلود غير قابل للاستخدام في المهام الهندسية المعقدة" في المستودع الرسمي لكود كلود. لم يكن هذا مجرد شكوى عاطفية من المستخدم، بل كان تحليلاً كمياً يستند إلى 6800 جلسة. لقد أبرزت هذه القضية أكثر المشاكل التي يتجنب مجتمع الذكاء الاصطناعي مواجهتها، مع بروز مجموعة واحدة من الأرقام بشكل خاص: فقد أدى تعديل بسيط في التكوين من قبل شركة Anthropic إلى رفع فاتورة واجهة برمجة التطبيقات الشهرية لهذا الفريق من 345 دولارًا إلى 42121 دولارًا.

قام فريق لورينزو بتتبع 235000 عملية استدعاء للأداة، و18000 مطالبة، وقام بتوثيق التدهور المنهجي في أداء Claude Code منذ فبراير 2026. وقد غطت صحيفة "ذا ريجستر" هذا التقرير لاحقاً، مما أثار عاصفة من الرأي العام استمرت أسبوعين في أوساط مجتمع المطورين.

قدم بوريس تشيرني، رئيس فريق Anthropic Claude Code، شرحاً على موقع Hacker News. في 9 فبراير، مع إصدار Opus 4.6، تم تفعيل آلية "التفكير الذاتي" بشكل افتراضي، حيث يقرر النموذج بشكل مستقل مدة التفكير. وفي 3 مارس، خفضت شركة أنثروبيك مستوى جهد التفكير الافتراضي إلى 85. وكان التفسير الرسمي هو "نقطة التوازن الأمثل بين الذكاء وزمن الاستجابة والتكلفة". ويتضح الأثر الفعلي لهذين التعديلين من البيانات.

انخفض عمق الفكر بمقدار ثلاثة أرباع

وفقًا لبيانات مشكلة GitHub الخاصة بـ Stella Laurenzo، شهد متوسط عمق التفكير لدى Claude Code انهيارًا على ثلاث مراحل على مدار شهرين: من ذروة بلغت 2200 حرف في نهاية يناير إلى 720 حرفًا بحلول نهاية فبراير، أي بانخفاض قدره 67٪. وبحلول شهر مارس، انخفض العدد أكثر إلى 560 حرفًا، أي بانخفاض قدره 75% عن ذروته.

رحلة كلود إلى الحماقة في الرسوم البيانية: ثمن التوفير، أو كيف ارتفعت فاتورة واجهة برمجة التطبيقات 100 ضعف

يُعد عمق التفكير هنا مقياسًا تقريبيًا يعكس مقدار "المداولات الداخلية" التي يرغب النموذج في الانخراط فيها قبل تقديم إجابة. إن الفرق بين 2200 و 560 حرفًا يعادل تقريبًا التدهور من "الكتابة قبل الرد" إلى "التفكير لمدة ثانيتين في رأسك قبل التحدث".

وأشار لورينزو أيضًا إلى أن ميزة "تنقيح محتوى الأفكار" (redact-thinking-2026-02-12) التي تم إطلاقها في أوائل مارس قد أخفت بالصدفة عملية تفكير النموذج خلال هذه الفترة، مما جعل الانكماش أقل وضوحًا للمستخدمين. يصر بوريس تشيرني على أن هذا كان مجرد تغيير في واجهة المستخدم did-133">ولم يؤثر على المنطق الأساسي. كلا الادعاءين صحيحان من الناحية الفنية، ولكن من وجهة نظر المستخدم، فإن التأثير لا يمكن تمييزه.

أقر بوريس تشيرني لاحقًا بأنه حتى مع إعادة ضبط الجهد يدويًا إلى الحد الأقصى، قد تظل آلية التفكير الذاتي تخصص تفكيرًا غير كافٍ في بعض الجولات، مما يؤدي إلى محتوى هلوسي. إن "استعادة أقصى جهد" ليس حلاً كاملاً؛ إنه ببساطة يعيد المقبض إلى وضعه الأصلي بدلاً من إعادته إلى حتميته الأصلية.

من "مبرمج ذو توجه بحثي" إلى "مبرمج يقوم بالتحرير الأعمى"

هناك تفصيل في تقرير ستيلا لورينزو أكثر وضوحًا من عمق التفكير: عدد الملفات ذات الصلة التي يقرأها النموذج بنشاط قبل إجراء تغييرات على الكود.

وفقًا لبيانات GitHub Issue، خلال فترة الذروة، يبلغ متوسط نسبة القراءة إلى التحرير 6.6. قبل إجراء أي تغيير في الكود، يقوم النموذج، في المتوسط، بقراءة 6.6 ملفات لفهم السياق. خلال فترة التحلل، ينخفض هذا الرقم إلى 2.0، أي بانخفاض قدره 70%. والأهم من ذلك، أن حوالي ثلث عمليات تعديل التعليمات البرمجية تحدث دون أن يقوم النموذج بقراءة الملف المستهدف، حيث يتم الغوص فيه مباشرة.

يشير لورينزو إلى هذا باسم "التعديلات العمياء". من الناحية الهندسية، يشبه هذا قيام المبرمج بكتابة التعليمات البرمجية دون النظر إلى توقيعات الدوال أو معرفة أنواع المتغيرات. وكتبت في تقريرها: "لقد مر كل مهندس كبير في فريقي بتجارب مماثلة مباشرة". "لم يعد بالإمكان الوثوق بكلود لتنفيذ مهام هندسية معقدة."

إن الانخفاض من نسبة القراءة إلى التحرير من 6.6 إلى 2.0 ليس مجرد تحول في المقياس السلوكي؛ بل يدل على انهيار في معدلات نجاح المهام. إن تعقيد مستودعات التعليمات البرمجية الحديثة يفرض أن أي تعديل ينطوي على تبعيات عبر ملفات متعددة. إن تخطي استكشاف السياق وإجراء التغييرات مباشرة لا يؤدي إلى مجرد "إجابات غير صحيحة" بل إلى "تغييرات تبدو صحيحة ولكنها تؤدي إلى ظهور أخطاء جديدة في المراحل اللاحقة". إن تكلفة تصحيح مثل هذه الأخطاء تتجاوز بكثير تكلفة إجابة صريحة واحدة فاشلة.

مفارقة "توفير المال"

إحدى أكثر مجموعات الأرقام غير البديهية في الحادثة بأكملها تأتي من بيانات مشكلة GitHub نفسها: شهد فريق ستيلا لورينزو انخفاضًا كبيرًا في تكاليف استدعاء واجهة برمجة تطبيقات Claude Code الشهرية من 345 دولارًا في فبراير 2026 إلى 42121 دولارًا في مارس، أي بزيادة قدرها 122 ضعفًا.

كان المنطق وراء تقليل الجهد في مشروع أنثروبكس هو خفض استهلاك الرموز المميزة لكل مكالمة، وبالتالي تقليل التكاليف. لكن النتيجة كانت عكس ذلك. والسبب وراء ذلك هو ظهور العديد من "حلقات الاستدلال" بعد تدهور النموذج، مما أدى إلى نفي ذاتي متكرر في رد واحد، وإعادة تشغيل مستمرة، واستهلاك للرموز يتجاوز بكثير الكمية المحفوظة. وفقًا لبيانات ستيلا لورينزو، زاد معدل المستخدمين الذين يلغون المهام طواعية بمقدار 12 مرة خلال نفس الفترة، مما يتطلب تدخل المطورين المستمر وتصحيحها وإعادة إرسالها.

المنطق الكامن وراء ذلك هو خطأ منهجي. إن خفض القدرة الحاسوبية في مهمة معقدة لا يؤدي ببساطة إلى تقليل التكاليف بشكل متناسب. بمجرد أن ينخفض مستوى التفكير عن حد معين، يبدأ النموذج في الانحراف عن مساره، وتتصاعد التكلفة الإجمالية في نهاية المطاف. أدى تقليل الجهد إلى توفير المال في الاستعلامات البسيطة، ولكن في مهام البرمجة، أدى ذلك إلى زيادة الفاتورة بشكل كبير.

"تبسيط الأمور"، قام به GPT-4 قبل ثلاث سنوات

في يوليو 2023، نشر فريق بحثي من جامعة ستانفورد وجامعة كاليفورنيا في بيركلي ورقة بحثية على موقع arXiv بعنوان "كيف يتغير سلوك ChatGPT بمرور الوقت؟"، موثقةً حدوث نفس الظاهرة على GPT-4.

وفقًا لبيانات البحث، في مارس 2023، قام GPT-4 بتوليد كود كان أكثر من 50% منه قابلاً للتنفيذ مباشرة. وبحلول شهر يونيو، انخفضت هذه النسبة إلى 10%، أي بانخفاض قدره 80% خلال ثلاثة أشهر. وخلال نفس الفترة، انخفضت دقة تحديد الأعداد الأولية من 97.6% إلى 2.4%. كان رد OpenAI مشابهًا جدًا لرد Anthropic: فقد كانت هناك تحسينات في الخلفية، كجزء من التكرار الطبيعي.

إن بنية القصتين متطابقة تقريبًا: قامت شركة الذكاء الاصطناعي بهدوء بتعديل المعلمات التي تؤثر على قدرات النموذج في الخلفية، ولاحظ المستخدمون ذلك، واعترفت الشركة بالتعديل، لكنها شرحته على أنه "تخصيص أكثر منطقية للموارد". حدث تدهور GPT-4 في عام 2023، وحدث تدهور Claude في عام 2026، بفارق ثلاث سنوات، لكن السيناريو هو نفسه.

هذا ليس خطأً خاصاً بشركة معينة. يحدد المنطق الاقتصادي لنماذج الاشتراك في الذكاء الاصطناعي أنه عندما تتجاوز تكاليف الاستدلال الأسعار التي يمكن تغطيتها، فإن المصنعين يواجهون نفس الضغط. يُعد خفض مستوى التفكير الافتراضي حاليًا أسهل طريقة للموازنة بين التكلفة والأداء. ما يلاحظه المستخدمون هو أن النموذج "يصبح أغبى". ما يوفره المصنّع في السجلات هو التكلفة الحدية للرمز المميز لكل مكالمة.

قدم بوريس تشيرني حلاً تقنياً حيث يمكن للمستخدمين استعادة كثافة التفكير يدوياً إلى أعلى مستوى من خلال الأمر /effort high أو عن طريق تعديل ملف التكوين. هذا الحل ممكن من الناحية التقنية، ولكنه يعني أيضاً أن "أقصى أداء" لم يعد الإعداد الافتراضي.

من 345 دولارًا إلى 42121 دولارًا، لم يكن ما تم إنفاقه مجرد ميزانية فحسب، بل كان أيضًا افتراضًا: التغييرات الافتراضية في التكوين التي أجراها المصنع كانت تهدف إلى تحسين تجربة المستخدم.

قد يعجبك أيضاً

النص الكامل وتحليل كلمة الرئيس التنفيذي لشركة SanDisk في مؤتمر بيرنشتاين السنوي الثاني والأربعين للقرارات الاستراتيجية

تكمن القيمة الجوهرية لخطاب Goeckeler في تقديمه لإطار عمل سردي يتسم بالشفافية العالية والوضوح المنطقي للتحول المؤسسي.

تقرير الصباح | Coinbase Ventures تقوم بأول استثمار لها في ENA؛ وSpaceX تخطط لتحديد سعر الطرح العام الأولي عند 135 دولاراً للسهم

نظرة عامة على أحداث السوق المهمة في 3 يونيو

وول ستريت جورنال: Hyperliquid تتحول إلى "متجر شامل" للعملات المشفرة في وول ستريت

أصبحت Hyperliquid منصة تداول تعمل على مدار الساعة طوال أيام الأسبوع، حيث يتدفق المزيد من متداولي العملات المشفرة والأسواق التقليدية إلى المنصة للمراهنة على جميع الأصول تقريباً.

الأسهم الأمريكية المرمزة ليست "قاتل السيولة" لسوق العملات المشفرة

"مع التخلص التدريجي من العملات عديمة القيمة، ستتاح الفرصة للبروتوكولات والبنية التحتية والمنتجات المالية التي يمكنها خلق قيمة حقيقية للحصول على تقييمات أكثر منطقية."

ما هو TradFi ولماذا يتحدث الجميع عنه في عام 2026؟

الذهب في حالة صعود، وSpaceX تتجه نحو طرح عام أولي تاريخي، ولا يزال النفط شديد التقلب. اكتشف لماذا عاد TradFi إلى دائرة الضوء وكيف يمكن لمتداولي العملات المشفرة الوصول إلى هذه الفرص باستخدام USDT. بعبارة أخرى، يمر TradFi بأكبر لحظة في تاريخه، ومتداولو العملات المشفرة في وضع مثالي للاستفادة من ذلك.

تقرير الصباح | باعت Strategy نحو 32 BTC وأكثر من 800 ألف سهم من MSTR الأسبوع الماضي؛ Binance تعلن رسمياً عن بوابة تداول الأسهم الأمريكية؛ Polymarket تتوصل إلى شراكة حصرية مع OneFootball

نظرة عامة على أهم أحداث السوق في الأول من يونيو

معسكر WEEXPERIENCE التدريبي في بولندا: كيف تجعل WEEX وFireCrew تداول العملات الرقمية في متناول الجميع

دخلت WEEX في شراكة مع Firecrew في بولندا يوم 29 مايو لإقامة معسكر WEEXPERIENCE التدريبي. اقرأ ملخص الجلسات المتخصصة حول التحليل الفني، ونفسية التداول، وأدوات الذكاء الاصطناعي التي تثبت التزام WEEX بجعل تداول العملات الرقمية في متناول الجميع.

باريس تتربع على العرش: كيف حطم PSG حلم أرسنال في نهائي دوري أبطال أوروبا التاريخي

مواجهة PSG وأرسنال، دراما وقدر ولعنة العشرين عاماً التي انكسرت. استرجع أحداث نهائي دوري أبطال أوروبا 2026 حيث دافع PSG عن لقبه في ركلات ترجيح عصيبة، بينما كتبت لحظة عثمان ديمبيلي الذهبية وإضاعة ركلة جزاء مؤلمة التاريخ في بودابست.

TaiJi تغلق جولة تمويل استراتيجي بقيمة 3.5 مليون دولار، بمشاركة Castrum Capital وBecker Ventures وCoinvestor Ventures

أعلنت منصة TaiJi، وهي منصة ذكاء سوقي للسلاسل الكتلية (Web3) مدعومة بالذكاء الاصطناعي، عن إتمام جولة تمويل استراتيجي بقيمة 3.5 مليون دولار، مما سيسرع من بناء محرك جديد لمحاكاة سوق الذكاء الاصطناعي.

هل يعلق سعر البيتكوين عند 73 ألف دولار؟ كيف يجد المتداولون فرصاً للربح في سوق يونيو الجانبي

يعلق سعر البيتكوين بالقرب من 73 ألف دولار مع تراجع تدفقات صناديق الاستثمار المتداولة (ETF) وبقاء المتداولين في حالة حذر بسبب عدم اليقين الاقتصادي الكلي. إليك كيف تساعد حملات المكافآت مثل WEEX Joker Party المتداولين على البقاء نشطين خلال سوق يونيو الجانبي.

كيفية تخزين عملة Solana: دليل خطوة بخطوة لعام 2026

اعثر على أفضل عملات الذكاء الاصطناعي المشفرة لعام 2026 من خلال اختيارات قائمة على البيانات: Bittensor وRender والمشاريع الناشئة. يتضمن ذلك مقاييس السلسلة والمخاطر ودليل تداول WEEX.

ميزة السعر المضمون متاحة الآن على WEEX: نفذ صفقاتك بدقة أكبر

لتقديم تجربة تداول عقود آجلة أكثر سلاسة، أطلقت WEEX ميزة "السعر المضمون".

أحدث أبحاث بنك التسويات الدولية (BIS): مستقبل العملات المستقرة والمشهد النقدي العالمي

يرى التقرير أن العملات المستقرة ستعزز هيمنة الدولار الأمريكي على المدى القصير، مما يشكل مخاطر على السيادة النقدية للأسواق الناشئة والاقتصادات النامية، في حين سيعتمد المسار طويل الأجل على نماذج اعتمادها، والاستجابات التنظيمية، وتآزر...

مقابلة مع خبير الاقتصاد الكلي Raoul Pal: سباق الذكاء الاصطناعي يؤدي إلى "تفرد اقتصادي"، لا تتخلَّ عن أصولك بسهولة في السنوات الأربع القادمة

مقارنة بمؤشر ناسداك، يقع البيتكوين حالياً في منطقة ذروة البيع ضمن اتجاهه طويل الأجل.

تقرير الصباح | Coinbase Ventures تقوم بأول استثمار لها في ENA؛ وSpaceX تخطط لتحديد سعر الطرح العام الأولي عند 135 دولاراً للسهم

نظرة عامة على أحداث السوق المهمة في 3 يونيو