Por que o novo modelo de IA da Anthropic é poderoso demais para ser lançado – Tech 24

Uma das principais empresas de IA do mundo construiu um modelo tão poderoso que se recusa a divulgá-lo publicamente ainda, o que levou a conversações urgentes de Wall Street com os reguladores financeiros no Reino Unido.
A Anthropic afirma que seu novo modelo de IA, Claude Mythos Preview, é tão avançado na detecção de fraquezas de software que a empresa teme que possa se tornar a ferramenta mais poderosa de um hacker.
Acredita-se que ele tenha descoberto dezenas de milhares de vulnerabilidades críticas de software em todos os principais sistemas operacionais e navegadores da web. Durante os testes, o modelo supostamente saiu de forma autônoma de sua “sandbox”, um ambiente virtual seguro, e publicou de forma independente detalhes de sua própria fuga online.
Portanto, a Anthropic está impedindo o lançamento público.
Em vez disso, lançou o Project Glasswing, que dá acesso controlado ao modelo de IA a mais de 40 empresas tecnológicas e financeiras, incluindo Apple, Google e Microsoft, para encontrar e corrigir falhas em sistemas críticos antes de ser divulgado ao público em geral e aos hackers.
A Anthropic está apoiando o projeto com US$ 100 milhões em créditos de uso e US$ 4 milhões em doações para projetos de segurança de código aberto, e planeja compartilhar as descobertas
O anúncio desencadeou negociações de emergência em todo o mundo. A Bloomberg informou que na quinta-feira, o secretário do Tesouro dos EUA, Scott Bessent, e o presidente do Federal Reserve, Jerome Powell, convocaram uma reunião com CEOs de Wall Street para alertar sobre os riscos cibernéticos representados pelo mais recente modelo de IA da Anthropic.
Executivos de bancos canadenses se reuniram na sexta-feira e, no domingo, o Financial Times informou que os reguladores financeiros do Reino Unido também estavam realizando conversações urgentes com a agência governamental de segurança cibernética e os principais bancos.
Mas o tempo está correndo. Especialistas em segurança cibernética alertam que um modelo comparável poderá estar disponível publicamente dentro de meses a alguns anos, seja através de liberação controlada, de uma empresa rival ou de desenvolvimento de código aberto.
A OpenAI já está trabalhando em algo semelhante.



