في العامين الماضيين، غيرت الذكاء الاصطناعي مركز ثقلها. إذا كان كل شيء في 2022-2023 يدور حول النماذج الكبيرة وتدريبها، فإن المعركة الحقيقية اليوم لم تعد في بناء النماذج، بل في تنفيذها المستمر، وفي القدرة على الاستجابة لمليارات الاستفسارات كل يوم. إنها حرب inference، وهي أكثر أهمية مما تبدو عليه.
Messari يوضح ذلك بجلاء في تقريره “State of AI 2025”: بحلول عام 2030، ستمثل inference ما بين 50% و75% من الطلب العالمي على الحسابات. وهي نسبة مرتفعة لدرجة تعيد تشكيل جغرافية البنية التحتية للذكاء الاصطناعي بالكامل.
اليوم، في كل مرة يفتح فيها المستخدم ChatGPT، يقوم بإنشاء صورة، يطلب نصيحة، يحلل نصًا، يطلب من وكيل التصفح على الويب أو اتخاذ قرار: فإنه يستهلك inference. وينطبق الأمر نفسه على آلاف الوكلاء الذكاء الاصطناعي الذين ينفذون عمليات مستمرة في الخلفية، دون أن يراهم أحد.
النتيجة هي استهلاك حسابي ينمو بشكل عمودي، متجاوزًا بكثير ما هو ضروري لتدريب النماذج نفسها.
Summary
الضغط الجديد: مستخدمون حقيقيون، تفاعلات حقيقية
أسباب هذا النمو متعددة، لكنها جميعًا تتجه في اتجاه واحد: الذكاء الاصطناعي أصبح الآن خدمة جماهيرية. لم يعد المستخدمون يقتصرون على التجربة فقط؛ بل يستخدمون الذكاء الاصطناعي بشكل يومي، مطول، وبصورة متزايدة التعقيد.
أصبحت جلسات ChatGPT أطول وأكثر تعقيدًا: وفقًا للبيانات التي أوردتها Messari، فإن الوقت الذي يُقضى على النماذج قد تضاعف في عام واحد، وارتفع متوسط مدة الجلسة الواحدة بنسبة 75%. إنه إشارة واضحة جدًا: لم تعد الذكاء الاصطناعي مجرد مساعد “عرضي”، بل أصبح بيئة تشغيلية حقيقية حيث يبقى المستخدم لفترة أطول، ويقدم طلبات أكثر توسعًا وأكثر كثافة من حيث الرموز.
إلى جانب ذلك، هناك انفجار في استخدام الذكاء الاصطناعي للمستهلكين. في عام 2024، تجاوزت تطبيقات الذكاء الاصطناعي المليار تحميل، مع نمو يزيد عن 100% على أساس سنوي. يمتلك ChatGPT اليوم أكثر من 700 مليون مستخدم أسبوعيًا، بينما تتبع Gemini وCopilot وClaude وتيرة مماثلة. إنها موجة مستمرة من الطلبات التي تترجم إلى حسابات، وبالتالي إلى تكاليف.
عامل “الاستدلال”: النماذج الذكية تكلف أكثر بكثير
ما يجعل الأمر أكثر تعقيدًا هو صعود النماذج الموجهة نحو “reasoning”، تلك التي لا تكتفي بإكمال الجمل، بل تحاول التفكير، الشرح، والتخطيط. هذه النماذج تستهلك ما يصل إلى عشرة أضعاف عدد التوكنات للإجابة على نفس السؤال مقارنة بالنموذج التقليدي.
إذا أضفنا إلى ذلك حقيقة أن القطاع قد تبنى الآن تقنيات ما بعد التدريب القائمة على التعلم المعزز — كما أثبتت DeepSeek — فإن الضغط على الحوسبة يتزايد بشكل كبير. يولد التعلم المعزز آلاف التكرارات لكل مشكلة فردية، مما يضاعف استهلاك الحوسبة على نطاق صناعي.
بعبارة أخرى: كلما أصبحت الذكاء الاصطناعي أكثر ذكاءً، كلما زادت تكلفة تشغيلها.
مشكلة التكاليف: أصبحت الاستدلال “العقبة الرئيسية” الجديدة للذكاء الاصطناعي
هناك نقطة غالبًا ما يتم التقليل من شأنها: التدريب هو تكلفة ضخمة، ولكنه تكلفة مرة واحدة. بمجرد تدريب النموذج، يصبح موجودًا. أما الاستدلال، على العكس، فهو تكلفة مستمرة، لا نهائية، تتناسب مع عدد المستخدمين، والوكلاء، والتطبيقات التي تستخدمه.
بالنسبة للمختبرات الكبرى — OpenAI، Anthropic، Google — أصبحت عملية الاستدلال هي البند الرئيسي في النفقات. وهذه الديناميكية تخلق مساحة لثورة صامتة تتعلق بشكل وثيق بنظام التشفير البيئي.
المصدر المفتوح يقلب التوازن: نماذج أصغر، أسرع، وأكثر اقتصادية بكثير
بينما تستمر النماذج المملوكة في النمو من حيث الحجم والتعقيد، فإن المصادر المفتوحة تغلق الفجوة بسرعة. وفقًا لمعيار Artificial Analysis الذي أشار إليه Messari، فإن الفرق بين أفضل النماذج المغلقة وتلك المفتوحة على نطاق واسع أصبح اليوم ضئيلاً بشكل مدهش، خاصة عند مقارنته بالتكاليف.
نموذج مفتوح يحتوي على 120 مليار من المعاملات يكلف حتى 90% أقل في الاستدلال مقارنة بـ ChatGPT-5، مع خسارة في القدرة تعتبر هامشية بشكل عام.
لكن الثورة الحقيقية تتعلق بالنماذج small وmid-size التي تحتوي على ما بين 4 و40 مليار من المعاملات. اليوم، العديد من هذه النماذج قادرة على حل مهام معقدة حتى عند تشغيلها على وحدة معالجة رسومات واحدة للمستهلك مثل RTX 4090 أو 5090. هذا يعني أن الاستدلال لم يعد يجب أن يكون مركزيًا في مراكز بيانات ضخمة: يمكن توزيعه.
وهنا يجد عالم الذكاء الاصطناعي اللامركزي أرضه الطبيعية.
صعود شبكات الحوسبة اللامركزية (DCN): اقتصاد جديد للحوسبة
تقوم شبكات الحوسبة اللامركزية (DCN) — مثل Render، Akash، io.net، Aethir، Hyperbolic، EigenCloud وExabits — بتجميع ملايين وحدات معالجة الرسومات (GPU) الموزعة في جميع أنحاء العالم. لسنوات، كافحت هذه الشبكات للعثور على سوق حقيقي: كان تدريب النماذج الكبيرة معقدًا للغاية بسبب التأخير والتبادل المستمر للمعلومات بين وحدات معالجة الرسومات.
لكن الاستدلال هو قصة أخرى.
يتطلب الاستدلال تواصلًا أفقيًا أقل بكثير، ويمكن تنفيذه بطريقة موازية للغاية ويمكنه الاستفادة من الأجهزة المتنوعة. لا يحتاج إلى مجموعات مثالية ومتزامنة بشكل فائق. إنه عمل مثالي لآلاف العقد المنتشرة، خاصة الآن حيث أصبحت النماذج الأصغر قوية بشكل مدهش.
هذه المرة، السوق موجود بالفعل. ويصفه Messari بأنه أول “product-market fit” حقيقي لقطاع deAI بأكمله.
حالة Fortytwo: الذكاء الجماعي كدليل عملي
من بين الابتكارات الأكثر إثارة للاهتمام، يذكر التقرير Fortytwo Network، وهي شبكة تنسق نماذج صغيرة مثبتة على أجهزة الكمبيوتر المحمولة للمستخدمين. تعمل هذه النماذج معًا مثل سرب: كل واحد يجيب على نفس السؤال، ثم يقيم إجابات الآخرين، وأخيرًا تنتج الشبكة إجابة محسّنة بناءً على الإجماع.
يولد الآلية الائتمان والسمعة والمكافآت على السلسلة. وهي فعالة لدرجة أن Fortytwo تمكنت حتى من إنتاج مجموعات بيانات تم إنشاؤها بالكامل بواسطة السرب وتدريب نموذج متخصص في Rust، محققة نتائج تفوق النماذج الأكبر بكثير.
إنه مثال ملموس على كيف أن اللامركزية ليست فقط مرغوبة، بل إنها بالفعل تنافسية.
مسألة التحقق: العنصر الأساسي للاستدلال اللامركزي
في كل مرة يتم فيها تنفيذ طلب على عقدة موزعة، تبرز سؤال حاسم: كيف يمكن التأكد من أن النتيجة صحيحة؟ هنا تلعب العملات الرقمية دورًا حاسمًا.
تحلل Messari ثلاثة نهج سائدة اليوم:
- إثباتات المعرفة الصفرية (zkML)، بطيئة ولكنها آمنة للغاية؛
- الأنظمة التفاؤلية، حيث يُعتبر النتيجة صالحة ما لم يتم التحدي عليها؛
- البيئات الآمنة للأجهزة (TEE)، أسرع ولكن تعتمد على الثقة في الأجهزة.
من بين الرواد في هذا القطاع تُذكر EigenCloud، التي تقدم للسوق استنتاجًا حتميًا وقابلًا للتحقق، متوافقًا مع واجهات برمجة التطبيقات لـ OpenAI ويُستخدم بالفعل في أطر الوكلاء لـ Coinbase وGoogle.
التحقق ليس مجرد تفصيل تقني: إنه ما يجعل الذكاء الاصطناعي مناسبًا للتمويل، والصحة، والحكم، والمعاملات الذاتية. إنه الجسر بين الذكاء الاصطناعي وWeb3.
المستقبل: اقتصاد من الوكلاء الذين يستهلكون الحوسبة بشكل مستمر
الخلاصة في التقرير واضحة: مستقبل الذكاء الاصطناعي لن تهيمن عليه النماذج الأكبر، بل من سيعرف كيف يقدم الاستدلال بطريقة أكثر قابلية للتوسع، اقتصادية، وقابلة للتحقق قدر الإمكان. إذا كان المستخدمون البشريون اليوم يولدون ملايين الطلبات، فإن الوكلاء المستقلين سيولدون مليارات منها غدًا. وكل واحدة من هذه الطلبات سيكون لها تكلفة حسابية.
في تلك المرحلة، لن تكون شبكات الحوسبة اللامركزية مجرد بديل تجريبي بعد الآن: ستصبح ضرورة اقتصادية.
الخاتمة
نحن ندخل في عصر الاستدلال، وليس التدريب.
عصر تتزايد فيه الطلبات بلا حدود، حيث لم يعد الحساب استثمارًا معزولًا بل تدفقًا مستمرًا، وحيث يجب تقديم ملايين النماذج — كبيرة أو صغيرة — كل ثانية.
وهنا بالتحديد، في هذا الفضاء الاقتصادي الضخم، يجد عالم العملات الرقمية دوره الأكثر طبيعية: وهو تنسيق، والتحقق، وتوزيع، وتوفير القوة الحسابية اللازمة لدعم مجتمع يزداد ذكاءً باستمرار.

