وبحسب تحليل أحدث منشور لنيفيديا، فإن وحدات معالجة الرسوميات Blackwell تكلف ما يقارب ضعف السعر لكل ساعة مقارنةً بجيل Hopper، لكنها تحقق تكاليف استدلال أقل لكل توكن بنسبة 35 ضعفًا. باستخدام نموذج DeepSeek-R1 كاختبار، يستأجر Blackwell (GB300 NVL72) بسعر 2.65 دولار لكل وحدة معالجة رسوميات في الساعة مقابل 1.41 دولار لوحدات Hopper، لكن الإنتاجية على مستوى وحدة معالجة رسوميات واحدة تقفز من 90 إلى 6,000 توكن في الثانية. يؤدي هذا التحسن في الإنتاجية بمقدار 65x إلى خفض تكاليف التوكنات لكل مليون توكن من 4.20 دولارات إلى 0.12 دولار.
تُفترض قيمة 0.12 دولار تحقيق تحسين كامل على مستوى البرمجيات، بما في ذلك الاستدلال منخفض الدقة FP4 والتنبؤ متعدد التوكنات (MTP). وبدون تفعيل MTP، تصل تكاليف مليون توكن إلى نحو 2.35 دولار، وتنخفض إلى 0.11 دولار عند تفعيله، ما يُظهر أثر تحسين بمقدار 21x ناجمًا عن هذه الميزة وحدها.