Alerte de fuite de données DeepSeek démentie ; des jetons spéciaux déclenchent la mémoire du modèle, sans brèche multi-tenant

DEEPSEEK18,86%
D’après le suivi de Beating, une affirmation virale récente prétendait que l’insertion de tokens spéciaux comme <|begin_of_sentence|> dans la boîte de discussion de DeepSeek pourrait exposer les conversations d’autres utilisateurs, qualifiée d’échec d’isolation multi-tenant de niveau P0. En réalité, ce phénomène n’a aucun rapport avec l’isolation des données. Lorsqu’il est déclenché avec de tels tokens, le modèle entre dans ses schémas de format propres à l’entraînement et génère un dialogue fabriqué à partir de sa mémoire et de ses invites système, et non via une récupération en temps réel depuis d’autres sessions. Il s’agit d’une extraction de données d’entraînement, une vulnérabilité partagée par l’ensemble des grands modèles de langage, et non propre à DeepSeek. Google DeepMind a publié en 2023 une recherche montrant que des entrées spéciales peuvent extraire des données d’entraînement depuis GPT et PaLM. L’article Magpie ICLR 2025 exploite directement ce mécanisme. Les affirmations selon lesquelles le contenu divulgué inclurait la date d’aujourd’hui ne prouvent pas un échec d’isolation multi-tenant, car DeepSeek inclut la date actuelle dans son invite système, et les modèles l’intègrent naturellement dans la sortie générée.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire