OpenAI Rastreia o Problema do Goblin até um Sinal de Recompensa da Personalidade “Nerd”, As Menções a Goblin Disparam 175% no GPT-5.1

De acordo com a OpenAI, a empresa identificou a causa raiz do problema do “goblin” que assolou os modelos GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar a característica de personalidade “Nerdy” incentivava a produção de resultados com referências a criaturas de fantasia, com 76,2% do conjunto de treino a evidenciar este viés. A personalidade Nerdy representava apenas 2,5% das respostas do ChatGPT, mas contribuiu com 66,7% das menções a goblins, com ocorrências a disparar 3.881% de GPT-5.2 para GPT-5.4.

A OpenAI removeu a personalidade Nerdy em março, eliminou o sinal de recompensa enviesado e filtrou os dados de treino. A empresa também adicionou instruções de supressão aos prompts de developer do GPT-5.5 no Codex. A investigação levou ao desenvolvimento de novas ferramentas de auditoria do comportamento dos modelos.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário