Los investigadores implementan la tecnología DPN-LE para editar los rasgos de personalidad de la IA, modificando solo el 0,5% de las neuronas

Según BlockBeats, el 3 de mayo, el investigador de IA Brian Roemmele reveló que su empresa Zero-Human ha implementado la tecnología DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar con precisión las características de comportamiento de los AI Agents. La tecnología localiza las “neuronas de personalidad” en la capa MLP del modelo, lo que permite mejorar o reducir de forma específica rasgos como la honestidad, la creatividad, la cautela y la colaboración. Al editar aproximadamente el 0,5% de las neuronas, el método permite ajustes quirúrgicos a la personalidad de la IA sin necesidad de reentrenar el modelo, a la vez que minimiza los daños a las capacidades centrales de razonamiento. Roemmele afirmó que su empresa, compuesta por más de 100 AI Agents, puede reconfigurar personalidades y desplegar agentes en minutos, reduciendo de manera significativa los costes de alineación de la IA.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios