1️⃣ GitHub deixou o Copilot escolher o modelo sozinho GitHub actualizou o Copilot CLI com selecção automática por tarefa: olha para saúde dos modelos, disponibilidade, complexidade de código, diagnóstico de bugs e necessidade de tool orchestration. No mesmo dia, pôs o Copilot Vision em GA.

💡 Porque importa Para equipas que vivem dentro do terminal, a escolha do modelo começa a virar parte da infra. Menos selector manual, mais routing por custo, latência e dificuldade.

☕ Conversa de café Se o CLI já decide o modelo por ti, quem é que ainda está a fazer governance numa dropdown?


2️⃣ ScarfBench puxou os agents para Java velho IBM Research publicou o ScarfBench, benchmark aberto para migrações Java entre Jakarta EE, Quarkus e Spring. Tem 102 aplicações, 6 camadas e 1.331 testes; nos resultados reportados, mesmo os melhores agents ficam abaixo de 10% de sucesso comportamental.

💡 Porque importa Compilar não chega. Migração empresarial mexe em build, runtime, dependências, persistência e comportamento. É aqui que muitos demos de coding agent perdem o verniz.

☕ Conversa de café Quantos roadmaps de modernização aguentam um benchmark onde passar nos testes ainda é a parte fácil?


3️⃣ Hugging Face juntou voz em tempo real ao Gemma 4 Hugging Face e Cerebras mostraram uma pipeline aberta speech-to-speech: Parakeet para ASR, Gemma 4 VLM em Cerebras para inferência e Qwen3TTS para resposta falada. A mesma base já corre nos Reachy Mini.

💡 Porque importa Voz com IA deixa de ser só modelo bom. O que conta é latência previsível no loop inteiro, sobretudo quando há multimodal e várias chamadas pelo meio.

☕ Conversa de café Nos robots e assistentes de voz, quanto atraso é que ainda parece inteligência e quando passa a parecer avaria?