Tecnologia

A Apple está abrindo o Siri para escolher modelos de IA, mas só isso faz sentido para mim


A Apple nos prometeu um sistema mais inteligente e mais Siri capaz na WWDC 2024. A proposta era convincente: uma Siri que entende seu contexto pessoal, vasculha suas mensagens e e-mails, executa ações dentro de seus aplicativos e se transforma em um verdadeiro assistente.

Dois anos depois, esse sonho ainda continua sendo um sonho. Mas aqui está o que pode mudar o rumo do assistente da Apple. Segundo relatos, Siri não está mais ligada a um único cérebro de IA. A Apple está construindo-o para ser flexível, capaz de encaminhar solicitações para qualquer modelo externo que faça o trabalho melhor.

Isso me fez fazer uma pergunta. Se o Siri puder usar qualquer IAqual deve usar? No momento, o modelo externo padrão é ChatGPT. Mas eu diria que Gêmeos é a escolha mais lógica, e aqui está o porquê.

Siri é um mecanismo de busca

Pense em como você realmente usa o Siri diariamente. Você pergunta sobre o clima do dia. Você pergunta sobre os restaurantes mais próximos de você. Você pede para procurar coisas na web. Uma parte significativa do uso da Siri envolve pesquisas ou consultas semelhantes, e nenhuma empresa no planeta o faz. pesquisa melhor que o Google.

O Google passou décadas construindo o mecanismo de busca mais poderoso, e esse conhecimento agora flui diretamente para Gêmeos. Quando você pergunte algo a Gêmeosele não extrai apenas de um modelo de linguagem. Ele extrai dados do índice da web em tempo real do Google, Google Maps, Google Shopping e muito mais.

Usar isso para potencializar a capacidade de pesquisa do Siri irá levá-lo a novos patamares que nenhum outro provedor de LLM pode igualar.

A Apple prometeu inteligência pessoal, mas Gemini está entregando

Um dos maiores pontos de discussão do anúncio WWDC 2024 da Apple foi a inteligência pessoal. A Apple mostrou ao Siri trazendo à tona informações contextuais de seus aplicativos, respondendo a perguntas como “quando é o voo da minha mãe pousando?” ou “mostre-me fotos de Stacy com seu casaco rosa de Nova York”.

Foi genuinamente impressionante em forma de demonstração. No entanto, se eu pedir para me mostrar uma foto minha vestindo uma camiseta preta, ele mostrará fotos aleatórias de pessoas da web vestindo camisetas pretas. Não estou exagerando quando digo que o recurso de inteligência pessoal da Siri foi um fracasso colossal.

Enquanto isso, a Gemini lançou silenciosamente seu próprio recurso de Inteligência Pessoal. Ele acessa seu Gmail, Agenda, Google Fotos, Drive e muito mais para analisar seus dados pessoais e responder a perguntas complexas do contexto da vida. Não é perfeito, mas pelo menos está funcionando.

Isso é quase palavra por palavra o que a Apple estava demonstrando como um futuro recurso Siri, exceto Gêmeos está fazendo isso hoje. Se a Apple quiser acelerar a entrega desses recursos aos usuários, o Gemini pode ser o atalho de que precisam.

Gêmeos já faz o que Siri prometeu

A Apple Intelligence implementa um modelo de IA compacto e capaz em aplicativos do sistema, combinando processamento no dispositivo para privacidade com computação baseada em nuvem para tarefas mais exigentes. Os aspectos de processamento e privacidade no dispositivo são o que diferenciam a Apple da concorrência. Mas não está sozinho agora.

Gemini Nano já está fazendo isso em dispositivos Pixel e Samsung Galaxy. Ele possibilita resumo offline, respostas inteligentes e recursos contextuais, tudo sem a necessidade de conexão com a Internet. Sobre Pixel 9 e mais recente, o Gemini Nano é multimodal e pode processar imagens, textos e idiomas diretamente no dispositivo.

A Apple está construindo algo que o Google já lançou. Em vez de reinventar essa roda, usar a implantação existente do Nano do Gemini como base para os recursos do Siri no dispositivo pouparia muita dor de cabeça e dinheiro à Apple.

O kit de ferramentas criativas de Gemini está repleto

É aqui que tudo fica genuinamente emocionante. Gêmeos não é apenas um modelo de texto. Ele vem com todo um ecossistema criativo que a Apple poderia explorar.

Eu vejo lida com geração de vídeo em até 1080p, com estilos cinematográficos e clipes com mais de um minuto. Líriado Google DeepMind, lida com a geração de música e áudio. Para imagens, Nanobanana (serviço de geração de imagens do Google) recebeu recentemente uma grande atualização, com melhor renderização de texto, consistência de assunto e suporte para qualquer proporção.

A Apple recentemente lançou seu próprio Estúdio de Criaçãodando aos usuários acesso a ferramentas criativas por uma assinatura mensal fixa. Se a empresa quer realmente competir com empresas como a Adobe, ela precisa oferecer recursos geradores. Adivinhe, o Gemini já possui todos esses recursos e faria todo o sentido integrá-lo ao pacote criativo da Apple.

A parceria já existe

Este ponto não é discutido o suficiente. O Google supostamente paga à Apple cerca de 20 bilhões de dólares todos os anos para continuar sendo o mecanismo de busca padrão no Safari. Esse é um dos acordos de distribuição mais valiosos da história da tecnologia. A relação entre a Apple e o Google é profunda, duradoura e financeiramente enorme para ambas as empresas.

Estender esse relacionamento de “Google potencializa a pesquisa no Safari” para “Gemini potencializa os recursos de IA da Siri” não é um salto dramático. É uma evolução natural de uma parceria que executa metade do que acontece quando você abre um navegador no seu iPhone.

Então, com qual modelo eu ficaria?

Cláudio é excelente para leitura em contexto longo e raciocínio matizado. Bate-papoGPT tem um ecossistema enorme e fortes ferramentas de codificação e agente. Ambos funcionam muito bem como especialistas escolhidos pelo usuário. Eu mesmo uso o Claude no meu computador.

Mas como é o mecanismo padrão sob o capô do Siri? Eles não são a escolha certa. Gemini opera no nível do sistema operacional em dispositivos móveis, entende pesquisas e contextos pessoais, existe em um formato Nano no dispositivo e está no centro do relacionamento comercial mais importante que a Apple tem com qualquer empresa de tecnologia.

As peças estão todas lá. Não é uma questão de saber se o Gemini poderia alimentar um Siri mais inteligente. É uma questão de saber se o Google e a Apple podem chegar a um acordo mutuamente benéfico. E se os rumores servirem de referência, as coisas já podem estar caminhando nessa direção.


Source link

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo