Local

O novo modelo de IA do Alibaba tem pontuação superior à do OpenAI, rival do Google na classificação de codificação

Holding do Grupo Alibaba mais recente modelo de inteligência artificial conquistou um lugar de destaque em uma importante tabela de classificação de codificação global, tornando a gigante da tecnologia chinesa o único desenvolvedor além da Anthropic a entrar nos cinco primeiros lugares do ranking.
Qwen3.7-Máx.o mais recente modelo de IA do Alibaba, obteve 1.541 pontos no ranking Code Arena e conquistou o quarto lugar globalmente, colocando-o à frente dos modelos rivais da OpenAI e do Google. Os outros quatro lugares entre os cinco primeiros foram ocupados por várias iterações dos modelos Claude da potência da IA ​​Anthropic.

Alibaba é dona do South China Morning Post.

A classificação ocorre no momento em que os desenvolvedores chineses de IA estão cada vez mais migrando de aplicativos de uso geral bots de bate-papo em direção a agentes de codificação especializados e outros sistemas autônomos, que os investidores consideram as aplicações comercialmente mais viáveis ​​para IA generativa.

Ao contrário dos benchmarks de codificação tradicionais, como HumanEval ou SWE-bench, que dependem de testes padronizados, os usuários do Code Arena testam até que ponto os modelos podem construir de forma independente aplicações web completas e interativas a partir do zero, com base nas solicitações do usuário.

Os usuários então votam em resultados anônimos em comparações cegas, o que significa que o placar reflete de perto as preferências dos desenvolvedores do mundo real.

O benchmark é administrado pela Arena, uma organização fundada por pesquisadores da Universidade da Califórnia, Berkeley, em colaboração com a Universidade da Califórnia em San Diego e a Universidade Carnegie Mellon.

Source

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo