Alarma por filtración de datos de DeepSeek desmentida; los tokens especiales activan la memoria del modelo, no una brecha multiinquilino

Según la supervisión de Beating, una afirmación viral reciente sugirió que introducir tokens especiales como <|begin_of_sentence|> en el cuadro de chat de DeepSeek podría exponer las conversaciones de otros usuarios, catalogado como un fallo de aislamiento multiusuario a nivel P0. En realidad, este fenómeno no está relacionado con el aislamiento de datos. Cuando se activa con esos tokens, el modelo entra en los patrones de formato de su entrenamiento y genera diálogos fabricados basándose en su propia memoria y en los prompts del sistema, no en una recuperación en tiempo real a partir de otras sesiones. Esto es Extracción de Datos de Entrenamiento, una vulnerabilidad compartida entre todos los modelos de lenguaje grandes, no exclusiva de DeepSeek. Google DeepMind publicó en 2023 una investigación que demuestra que las entradas especiales pueden extraer datos de entrenamiento de GPT y PaLM. El trabajo Magpie de ICLR 2025 aprovecha directamente este mecanismo. Las afirmaciones de que el contenido filtrado incluye la fecha de hoy no demuestran un fallo de aislamiento multiusuario, ya que DeepSeek incluye la fecha actual en su prompt del sistema, y los modelos la incorporan de forma natural en la salida generada.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios