Mundo

A corrida entre IA entre EUA e China se intensifica à medida que DeepSeek lança modelo de custo “reduzido”

A startup chinesa DeepSeek lançou um novo modelo de inteligência artificial com custos “drasticamente reduzidos” na sexta-feira, mais de um ano depois de surpreender o mundo com um modelo de raciocínio de baixo custo que correspondia às capacidades dos rivais dos EUA.

A corrida pela IA intensificou a rivalidade entre China e os Estados Unidos, e o Casa Branca na quinta-feira acusou entidades chinesas de um esforço massivo para roubar tecnologia de inteligência artificial.

A DeepSeek, com sede em Hangzhou, entrou em cena em janeiro do ano passado com um chatbot de IA generativo, alimentado pelo seu modelo de raciocínio R1, que derrubou as suposições de domínio dos EUA no setor estratégico.

A nova versão, DeepSeek-V4, “apresenta um contexto ultralongo de um milhão de palavras”, disse a empresa em comunicado na plataforma de mídia social WeChat, saudando-a como “líder mundial… com custos de computação (e) memória drasticamente reduzidos” em um anúncio separado no X.

A extensão do contexto do modelo, que determina quanta entrada um modelo é capaz de absorver para ajudá-lo a completar tarefas, “(alcança) liderança em campos domésticos e de código aberto em termos de capacidades de agente, conhecimento mundial e desempenho de raciocínio”, disse o comunicado do WeChat.

Uma “versão prévia” do modelo de código aberto já está disponível, disse a empresa.

Especialistas dizem que o lançamento do V4 marca um “ponto de inflexão” em termos de hardware e custo.

“Isso aborda os problemas de longa data de desempenho mais lento e custos mais elevados associados a longos períodos de contexto, marcando um ponto de inflexão genuíno para a indústria”, disse Zhang Yi, fundador da empresa de pesquisa tecnológica iiMedia.

“Para os usuários finais, isso trará benefícios generalizados e acessíveis. Por exemplo, se o suporte a contexto ultralongo se tornar um recurso padrão, espera-se que o processamento de texto longo ultrapasse os laboratórios de pesquisa de ponta e entre nas principais aplicações comerciais”, disse ele.

O novo V4 é lançado em duas versões, DeepSeek-V4-Pro e DeepSeek-V4-Flash, sendo esta última “uma escolha mais eficiente e econômica” por possuir parâmetros menores.

‘Momento Sputnik’

O V4-Pro possui 1,6 trilhão de parâmetros, enquanto o V4-Flash possui 284 bilhões de parâmetros, que refinam a capacidade de tomada de decisão dos modelos.

O modelo também foi “otimizado” para produtos populares de agentes de IA, como Claude Code, OpenClaw, OpenCode e CodeBuddy, disse o comunicado da DeepSeek.

“Em benchmarks de conhecimento mundial, o DeepSeek-V4-Pro lidera significativamente outros modelos de código aberto e é apenas ligeiramente superado pelo modelo de código fechado de nível superior, (Google‘s) Gemini-Pro-3.1″, acrescentou o comunicado.

O chamado “choque DeepSeek” do ano passado desencadeou uma venda de ações relacionadas com IA e um acerto de contas com a estratégia de negócios, no que também foi descrito como um “momento Sputnik” para a indústria.

O chatbot teve um desempenho semelhante ao Bate-papoGPT e outras ofertas americanas importantes, mas a empresa disse que foi necessário muito menos poder de computação para desenvolver.

No entanto, a sua súbita popularidade levantou questões sobre a privacidade e a censura dos dados, com o chatbot recusando-se frequentemente a responder a perguntas sobre temas delicados, como a campanha de 1989. Tiananmen repressão.

Internamente, as ferramentas de IA da DeepSeek foram amplamente adotadas pelos municípios e instituições de saúde chinesas, bem como pelo setor financeiro e outras empresas.

Isto foi parcialmente motivado pela decisão da DeepSeek de tornar os seus sistemas de código aberto, com o seu funcionamento interno público – em contraste com os modelos proprietários vendidos pela OpenAI e outros rivais ocidentais.

Mas a Casa Branca acusou as empresas chinesas de competirem para “roubar” tecnologia americana, antes de uma cimeira esperada entre Donald Trump e Xi Jinping em Pequim próximo mês.

“Os EUA têm evidências de que entidades estrangeiras, principalmente na China, estão realizando campanhas de destilação em escala industrial para roubar a IA americana”, disse o conselheiro-chefe de ciência e tecnologia de Trump, Michael Kratsios, em um post no X.

A destilação é uma prática comum no desenvolvimento de IA, frequentemente usada por empresas para criar versões menores e mais baratas de seus próprios modelos.

O anúncio da DeepSeek na sexta-feira também veio como meta disse que planeja cortar um décimo de seu pessoal enquanto busca ganhos de produtividade do restante da força de trabalho, ao mesmo tempo que investe pesadamente em inteligência artificial. Relatórios disseram Microsoft também estava procurando reduzir suas fileiras.

(FRANÇA 24 com AFP)

Source

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo