ChatGPT vai parar de falar sobre goblins e gremlins, pois se livra da personalidade “nerd”

Se você esteve conversando com Bate-papoGPT ultimamente e percebi que há referências estranhamente específicas a goblins, gremlins, ogros ou trolls, você não está imaginando coisas. OpenAI agora tem explicado por que o ChatGPT desenvolveu esse hábito estranho e como ele está sendo corrigido.
Como uma peculiaridade “nerd” se tornou problema de todos
O problema silenciosamente começou com GPT-5.1, lançado em novembro. Após esse lançamento, o uso da palavra “goblin” nas respostas do ChatGPT aumentou 175%, enquanto “gremlin” aumentou 52%. O culpado acabou sendo um dos Configurações opcionais de personalidade do ChatGPT chamado “Nerdy”, que foi projetado para fazer a IA parecer divertida e intelectualmente curiosa.
Durante o treinamento, a OpenAI acidentalmente deu ao modelo recompensas excepcionalmente altas por respostas que incluíam metáforas baseadas em criaturas, e o hábito se instalou rapidamente.
Como uma única configuração de personalidade causou tanta conversa sobre goblins?
É aqui que fica interessante. Até mesmo usuários que nunca ativaram a personalidade Nerdy começaram a ver referências a goblins surgindo em seus bate-papos. Isso ocorre porque o treinamento de IA não está restrito a um único ambiente. Uma vez que Modelo ChatGPT foi recompensado por esse estilo, o comportamento se transformou em respostas gerais em todos os níveis.
OpenAI diz que a personalidade Nerdy representou apenas 2,5% de todas as respostas do ChatGPT, mas foi responsável por 66,7% de todas as menções a goblins.
Então, como a OpenAI está realmente corrigindo isso?
OpenAI aposentou a personalidade Nerdy em março com Bate-papoGPT-5.4o que fez com que as referências aos goblins caíssem drasticamente. A empresa também eliminou o sinal de recompensa que impulsionava o comportamento e filtrou os dados de treinamento para reduzir referências a outras criaturas mágicas.
Sua ferramenta de codificação, Codexno entanto, precisava de uma instrução de substituição separada, uma vez que já havia começado o treinamento antes da identificação da causa raiz. Os fãs de fantasia ainda podem desbloquear o modo goblin no Codex manualmente, se preferir.
A OpenAI também está lidando com outras decisões relacionadas à personalidade, incluindo colocar seu anteriormente provocado modo adulto para usuários verificados em espera indefinidamente.
Source link




