منافسة رقائق الذكاء الاصطناعي خلال العامين الماضيين كانت تدور تقريبًا بالكامل حول HBM، لكن مع انتقال تطبيقات الذكاء الاصطناعي من تدريب النماذج إلى الاستدلال على نطاق واسع، قد لا يكون اختناق الإمداد التالي مجرد HBM، بل HBF (High Bandwidth Flash، ذاكرة فلاش عالية النطاق الترددي). صرّح الحائز على جائزة تورنغ، أستاذ جامعة UC Berkeley، David Patterson، في 30 أبريل في سان فرانسيسكو بالولايات المتحدة، بأنه يعتقد أن HBF قد يصبح تقنية الذاكرة الحاسمة للارتفاع السريع في الطلب تالياً، وحتى لتشكيل اختناق جديد.
(ماذا تغير في Nvidia Vera Rubin؟ تحليل حقبة معركة الذاكرة: SK Hynix، Samsung، Micron، SanDisk)
لماذا يتوقع David Patterson الحائز على جائزة تورنغ HBF؟
تدور مناقشات ذاكرة الذكاء الاصطناعي تقريبًا حول HBM (ذاكرة عالية النطاق الترددي)، لكن مع انتقال تطبيقات الذكاء الاصطناعي من تدريب النماذج إلى الاستدلال على نطاق واسع، قد لا يكون اختناق الإمداد التالي مجرد HBM، بل HBF (High Bandwidth Flash، ذاكرة فلاش عالية النطاق الترددي).
يُعد Patterson من الشخصيات الثقيلة في مجال علوم الحاسوب، ويُنظر إليه كأحد أهم المصممين في معمارية RISC. وعندما تحدث عن المرحلة التالية بعد HBM، أوضح أنه رغم وجود تحديات تقنية كثيرة لا تزال مطلوبة لمعالجتها في HBF، فإن HBF الذي تدفعه شركات مثل SK Hynix وSanDisk يتميز بميزة “توفير سعات كبيرة بقدرة أقل”، وما سيصبح متغيرًا أساسيًا في أنظمة الذكاء الاصطناعي في المستقبل لن يكون مجرد القدرة الحاسوبية، بل ما إذا كانت البيانات يمكن تخزينها وتنسيقها وتوفيرها بفعالية.
ما هو HBF؟ تكديس NAND Flash لا يعني استبدال HBM، بل تقسيم الأدوار
يتمثل أكبر اختلاف بين HBF وHBM في مادة الذاكرة الأساسية. يعتمد HBM على تكديس DRAM عموديًا لتوفير قدرة وصول إلى البيانات عالية النطاق الترددي مطلوبة للـGPU ومعجلات الذكاء الاصطناعي، ويتولى بشكل أساسي مهمة “تغذية وحدات المعالجة بالبيانات بسرعة”. أما HBF فيقوم بتكديس ذاكرة غير متطايرة NAND Flash، وتكمن ميزةُه الأساسية ليس في السرعة القصوى، بل في تقديم سعات أكبر بتكلفة أقل وقدرة أقل.
بعبارة أخرى، يعالج HBM مشكلة “السرعة” أثناء عملية حسابات الذكاء الاصطناعي، بينما يعالج HBF مشكلة “السعة” المتزايدة باستمرار في أنظمة الذكاء الاصطناعي. ولهذا السبب لا يُعد HBF مجرد بديل لـHBM، بل يشكل تقسيمًا جديدًا للأدوار بين نوعي الذاكرة. يتولى HBM مسؤولية تبادل البيانات الفوري والسريع؛ بينما يتولى HBF احتياجات التخزين للبيانات الوسيطة واسعة النطاق وبيانات السياق وعمليات استدعاء البيانات بشكل متكرر خلال مرحلة الاستدلال.
توسع سوق الاستدلال يجعل طلب HBF يطفو إلى السطح
ترجع زيادة الاهتمام بـHBF في 2026 إلى أن مركز ثقل سوق الذكاء الاصطناعي يتجه تدريجيًا من التدريب إلى الاستدلال. يتمثل تدريب الذكاء الاصطناعي في إطعام النموذج كميات ضخمة من البيانات ليكتسب المعلمات والأنماط؛ أما الاستدلال فهو مرحلة ما بعد اكتمال تدريب النموذج، حيث ينتج النموذج إجابات بناءً على مدخلات المستخدم، وينفذ المهام، ويحفظ السياق السابق ويستمر في اتخاذ الأحكام.
في سيناريوهات الاستدلال، لا يكون الذكاء الاصطناعي مجرد إجابة مرة واحدة عن سؤال، بل يحتاج إلى الاحتفاظ بالحديث السابق، وسياق العمل، ونتائج التقييم، وسجلات استدعاء الأدوات، وحتى بيانات وسيطة عبر المهام. هذه البيانات كبيرة الحجم، وتستلزم قراءتها وتحديثها بشكل متكرر.
المشكلة هي أن وضع جميع هذه البيانات في HBM قد يرفع التكاليف كثيرًا، كما أن السعة غير واقعية. HBM مناسب للتعامل مع البيانات عالية السرعة المطلوبة فورًا، لكنه لا يلائم لتحمل كل بيانات السياق والحالات الوسيطة الناتجة خلال عمليات الاستدلال. وعندما يصبح الذكاء الاصطناعي Agent، والنماذج طويلة السياق، والاستدلال متعدد الوسائط، وعمليات سير العمل الخاصة بالذكاء الاصطناعي على مستوى المؤسسات شائعًا، فإن النظام يحتاج ليس فقط إلى ذاكرة أسرع، بل إلى مجموعة أكبر من البيانات عالية السرعة. وهذا هو السبب وراء اعتقاد الكثيرين أن HBF مرشح لأن يحظى بالاهتمام.
SK Hynix وSNDK تدفعان نحو التوحيد القياسي، وقد يتجاوز طلب HBF HBM بحلول 2038
للسعي وراء زيادة عرض النطاق الترددي، طورت SK Hynix بالشراكة مع SanDisk HBF. وهي تقنية تكديس ثلاثي الأبعاد شبيهة بـHBM، لكنها تستخدم رقائق NAND، وتهدف إلى توفير إنتاجية أعلى بعدة مرات من SSD التقليدية، ومصممة خصيصًا لخدمة الاستدلال في الذكاء الاصطناعي.
كما أشار أستاذ قسم الهندسة الكهربائية والهندسة الحاسوبية في KAIST الكورية، Jin Sungho، خلال ندوة تقنية لـHBF في فبراير، إلى أن محور حقبة الحواسيب الشخصية هو CPU، ومحور حقبة الهواتف الذكية هو استهلاك الطاقة المنخفض، أما محور عصر الذكاء الاصطناعي فهو الذاكرة. وقد حدد أدوار HBM وHBF بوضوح: ما يحدد السرعة هو HBM، وما يحدد السعة هو HBF. وأضاف Jin Sungho أنه يتوقع أن تبدأ احتياجات HBF في تجاوز HBM بدءًا من عام 2038.
تستند هذه القراءة إلى منطق مفاده أن سوق الاستدلال في الذكاء الاصطناعي كلما اتسع، ستصبح السياقات الفورية والبيانات التاريخية وحالات المهام التي يحتاجها النموذج أكبر حجمًا. وإذا حاولنا الاعتماد على توسيع HBM فقط، فإن ذلك سيكون مكلفًا، كما سيؤدي إلى استمرار ارتفاع استهلاك الطاقة الإجمالي وضغط التغليف على النظام. إذا تمكن HBF من تحقيق اختراقات في عرض النطاق الترددي والتغليف والمتانة والتوحيد القياسي، فقد يتحول إلى طبقة الذاكرة الرئيسية من الجيل الجديد لمراكز بيانات الذكاء الاصطناعي.
من HBM إلى HBF، تتحول منافسة الذكاء الاصطناعي من “الحساب بسرعة” إلى “القدرة على التذكر والتنسيق”
في الماضي، عندما كان السوق يناقش أشباه موصلات الذكاء الاصطناعي، كان التركيز غالبًا على GPU والعمليات المتقدمة وعماد HBM. وخصوصًا بعد انفجار الطلب على خوادم Nvidia AI، أصبح HBM في وقت ما المؤشر الأساسي الذي يُستخدم لقياس قدرة شركات الذاكرة مثل SK Hynix وSamsung وMicron على المنافسة. لكن كلام Patterson يذكر السوق بأن عنق الزجاجة في البنية التحتية للذكاء الاصطناعي بات أكثر تعقيدًا.
عندما كان الذكاء الاصطناعي لا يزال في مرحلة سباق تدريب النماذج الكبيرة، كان التركيز على تزويد الـGPU بذاكرة عالية النطاق الترددي. لكن عندما يدخل الذكاء الاصطناعي مرحلة الاستدلال على نطاق واسع وتطبيقات الـAgent، يصبح السؤال: كيف يحافظ النموذج على السياق طوال مدة طويلة؟ كيف يمكن حفظ حالة المهمة بتكلفة أقل؟ وكيف نجعل البيانات تتدفق بكفاءة أكبر بين GPU وHBM وSSD وFlash والتخزين عبر الشبكة؟
لذلك، قد لا تتمثل منافسة ذاكرة الذكاء الاصطناعي في المرحلة التالية بعد في مجرد صراع على طاقة إنتاج HBM، بل في إعادة تنظيم كاملة لطبقات الذاكرة. سيظل HBM مهمًا لأنه يحدد ما إذا كانت رقائق الذكاء الاصطناعي قادرة على إجراء الحسابات بسرعة؛ لكن ظهور HBF يعني أن أنظمة الذكاء الاصطناعي بدأت تحتاج نوعًا جديدًا من طبقة البيانات يقع بين التخزين التقليدي والذاكرة عالية النطاق الترددي. قد لا يكون الأسرع، لكنه قد يوفر توازنًا جديدًا بين السعة واستهلاك الطاقة والتكلفة.
وهذا يعني أيضًا أن المصطلح الرئيسي المقبل في سلسلة إمداد الذكاء الاصطناعي قد يمتد من “الذاكرة عالية النطاق الترددي” إلى “الذاكرة فلاش عالية النطاق الترددي”. يعالج HBM اختناق الحساب الفوري للذكاء الاصطناعي، بينما قد يعالج HBF اختناق الذاكرة لبيانات أكبر حجمًا في عصر الاستدلال.
هل اختناق ذاكرة الذكاء الاصطناعي بعد HBM هو HBF؟ الحائز على جائزة تورنغ David Patterson: الاستدلال سيعيد تعريف بنية التخزين
أول ظهور: سلسلة أخبار ABMedia
مقالات ذات صلة
هوسكينسون يناقش دور Midnight في نظام كاردانو البيئي على The Breakdown
شركة Berkshire Energy ترى فرصة نمو مدفوعة بزيادة الطلب على الطاقة الناتجة عن الذكاء الاصطناعي
شهادة الأسبوع الأول في الدعوى بين ماسك وألتمن: اعترف بأن XAI تقوم بتقطير OpenAI، وتحذر من أن الذكاء الاصطناعي مثل المُنهي
استحواذ مالي بالذكاء الاصطناعي مرتبط بترا مب على بلوك ستريت مقابل 43 مليون دولار
أسهم Riot تقفز 8% بعد توسيع اتفاقية AMD الخاصة بمراكز البيانات
حظر ولاية مينيسوتا أدوات الذكاء الاصطناعي لإنشاء صور حميمة غير رضائية، مع فرض غرامات قد تصل إلى $500K