صرّح المحلل Zeitgeist بأن الطلب على رقائق الذاكرة المستخدمة في الذكاء الاصطناعي يفوق سعة الإنتاج العالمية الحالية بأوامر من حيث الحجم، ما يشير إلى أن مخزونات شركات تصنيع الذاكرة قد ترتفع عشرة أضعاف إذا تم تقييمها باحتياجات الحوسبة الفعلية بدلًا من القمم التاريخية. قدّم Zeitgeist مثالًا استثماريًا: كان استثمار 50,000 دولار في أسهم Micron في سبتمبر من العام الماضي سيبلغ ما يقارب 489,000 دولار اليوم. عزى المحلل اختلال العرض والطلب إلى حدود ذاكرة الوصول عالي النطاق الثابتة (HBM) في مسرّعات الذكاء الاصطناعي، وإلى الانتشار السريع لوكلاء الذكاء الاصطناعي الذين يستهلكون ذاكرة أكبر بكثير لكل جلسة من برامج الدردشة التقليدية، في تحول يجري بينما يتباطأ نمو إنتاج الذاكرة مقارنة بنمو الاستخدام.
تواجه مسرّعات الذكاء الاصطناعي حدودًا ثابتة للذاكرة
يأتي كل مسرّع ذكاء اصطناعي مزودًا بكمية ثابتة من الذاكرة عالية السرعة لا يمكن توسيعها بعد النشر. ووفقًا لـ Zeitgeist، تحمل شريحة H100 القياسية 80 GB من HBM، وتقدم الأجيال الأحدث حتى 192 GB، وسيحتوي B300 المرتقب على 288 GB. تحدّ هذه السقف قدرَ ما يمكن لمسرّع واحد معالجته من الطلبات في الوقت نفسه.
وأوضح المحلل أن العبء الرئيسي على الذاكرة لا يأتي من أوزان النموذج بل من ذاكرة KV cache—وهي ذاكرة الجلسة التي تنمو مع كل رمز يتم توليده. وقدّر Zeitgeist أن جلسة واحدة بسياق 128,000 رمز تتطلب نحو 20 GB من الذاكرة، ما يعني أن أربع جلسات من هذا النوع فقط ستستنفد بالكامل موارد شريحة H100 واحدة. ووفقًا للمحلل، تتطلب نماذج متقدمة مثل Claude Opus 4.8 أو GPT-5.5 من 40 GB إلى 100 GB لطلب طويل واحد.
يحسب المحلل عجزًا في الذاكرة بعامل 60 مرة بسبب اعتماد الوكلاء
حدّد Zeitgeist تحول الدردشة البسيطة إلى وكلاء الذكاء الاصطناعي باعتباره المحرك الرئيسي لطلب الذاكرة. ففي حين أن السؤال العادي يفرض عبئًا محدودًا على الذاكرة، يمكن لوكيل يستدعي الأدوات بشكل مستقل ويُراكِم السياق أن يصل بسهولة إلى 100,000 رمز أو أكثر. وقدّر المحلل أن عامل معرفة واحد يشغّل عشرة وكلاء من هذا النوع بالتوازي سيحتاج إلى نحو 152 GB من الذاكرة.
وأشار Zeitgeist إلى أن هناك نحو 250 مليون عامل معرفة حول العالم. وقدّر المحلل أنه إذا كانت هناك 100 جلسة وكيلية لكل شخص في اليوم، فستحتاج المنظومة العالمية إلى قرابة 60 مرة من الذاكرة أكثر مما سيتم إنتاجه في 2026. واعترف Zeitgeist بأن طرقًا جديدة للانتباه يمكن أن تقلل استهلاك الذاكرة بمقدار من 4 إلى 8 مرات، لكنه قال إن الطلب ينمو بوتيرة أسرع لأن الوكلاء يحلون محل الدردشات البسيطة، وتتمدد نوافذ السياق من 128,000 إلى 10 مليون رمز، ويتجه استخدام الذكاء الاصطناعي لكل عامل من لا شيء إلى مئات الجلسات.
تتجاوز SK Hynix Samsung مع تسارع طلب ذاكرة الذكاء الاصطناعي
تجاوزت شركة SK Hynix الكورية الجنوبية لتصنيع الذاكرة Samsung بوصفها الشركة المدرجة الأكثر قيمة في البلاد، مدفوعة بمكانتها في رقائق الذاكرة عالية النطاق (HBM) المستخدمة في أحمال عمل الذكاء الاصطناعي. قال Zeitgeist إن هذا التحول يدعم أطروحة أن مُنتجي الذاكرة باتوا مستفيدين كبارًا من سباق البنية التحتية للذكاء الاصطناعي، حيث تتموضع الشركات القادرة على إنتاج رقائق ذاكرة متقدمة في موقع يسمح لها برؤية نمو حاد في الإيرادات والتقييمات مع نمو طلب HBM بوتيرة أسرع من العرض.
الأسئلة الشائعة
ماذا قال المحلل Zeitgeist عن تقييمات أسهم شركات رقائق الذاكرة؟
ذكر Zeitgeist أن أسهم شركات تصنيع الذاكرة قد ترتفع عشرة أضعاف من مستوياتها الحالية إذا تم تقييمها بالاعتماد على احتياجات الحوسبة الفعلية بدلًا من القمم التاريخية، مشيرًا إلى أن طلب الذاكرة الخاصة بالذكاء الاصطناعي يتجاوز سعة الإنتاج العالمية بأوامر من حيث الحجم.
كم مقدار الذاكرة التي تتطلبها جلسة وكيل ذكاء اصطناعي وفقًا لـ Zeitgeist؟
حسب Zeitgeist أن جلسة واحدة بسياق 128,000 رمز تتطلب نحو 20 GB من الذاكرة، بينما تتطلب النماذج المتقدمة مثل Claude Opus 4.8 أو GPT-5.5 من 40 GB إلى 100 GB لطلب طويل واحد. وقدّر المحلل أن عامل معرفة يشغّل عشر جلسات لوكلاء بالتوازي سيحتاج إلى نحو 152 GB من الذاكرة.