DeepSeek a déployé son cadre d'accélération d'échantillonnage spéculatif DSpark pour les services de production DeepSeek-V4, à la suite d'un rapport technique conjoint avec l'Université de Pékin. DSpark augmente la vitesse de génération de 60 % à 85 % pour la version Flash et de 57 % à 78 % pour la version Pro sans compromettre la qualité des résultats.
DeepSeek a ouvert le code source de la pile complète DeepSpec aux côtés du cadre. DeepSpec prend en charge les modèles open-source populaires, notamment Qwen3 et Gemma, offrant aux développeurs une chaîne d'outils Python complète pour former des modèles personnalisés localement.