1️⃣ CoreWeave pôs um agente dentro do W&B CoreWeave lançou o ARIA, um agente de investigação em preview dentro do Weights & Biases. Lê dados de experiências, analisa milhares de runs e dezenas de milhares de métricas em minutos, cria dashboards e sugere próximos passos.

💡 Porque importa Para equipas de modelos, o gargalo está a sair do treino puro e a entrar na iteração: métricas, hipóteses, runs e decisões mais rápidas.

☕ Conversa de café Quem vai continuar a chamar isto observability quando o dashboard já propõe a próxima corrida?


2️⃣ Vercel juntou voz ao AI Gateway O AI Gateway da Vercel ganhou suporte beta para voz em tempo real, text-to-speech e speech-to-text, com modelos da OpenAI e da xAI. A integração chega via AI SDK 7, com tokens curtos no browser, routing, observability e controlos de gasto.

💡 Porque importa Apps que já usam gateway para modelos podem adicionar agentes de voz sem montar uma cadeia separada de transcrição, LLM e síntese de fala.

☕ Conversa de café A equipa que já mede custo por token está pronta para custo por chamada falada?


3️⃣ Gemini Nano ficou mais rápido no Pixel Google Research detalhou uma arquitectura MTP aplicada a modelos Gemini Nano v3 já treinados, agora no Pixel 9 e 10. A abordagem usa a cache KV existente, poupa cerca de 130 MB por instância e dá ganhos de velocidade de 50% ou mais face a drafters comparáveis.

💡 Porque importa On-device AI fica menos dependente de cloud, bateria e latência. Para developers, é uma forma de acelerar features locais sem treinar um drafter separado para cada tarefa.

☕ Conversa de café Se a resposta não muda e fica mais rápida, quem ainda culpa só o chip do telefone?