1️⃣ Google abriu uma Gemma que escreve por difusão Google lançou o DiffusionGemma, modelo experimental aberto baseado em Gemma 4: 26B MoE, 3,8B activos, geração por blocos de 256 tokens, licença Apache 2.0 e suporte vLLM/Hugging Face.
💡 Porque importa É uma aposta fora do token-a-token. Para inference local, o ganho prometido é velocidade; o teste é qualidade quando a tarefa não é Sudoku.
☕ Conversa de café 700 tokens/s num RTX 5090 impressiona, mas quem vai medir a resposta errada quando ela chega mais depressa?
2️⃣ OpenAI entrou na compra normal da Oracle OpenAI e Oracle dizem que clientes OCI vão poder usar Universal Credits elegíveis para aceder a modelos OpenAI e ao Codex nas próximas semanas.
💡 Porque importa Para empresas presas a compromissos cloud, isto muda menos o modelo e mais a aprovação interna: comprar AI sem abrir outro circuito.
☕ Conversa de café Quantos pilotos de AI estavam bloqueados pelo modelo ou pela ordem de compra?
3️⃣ Copilot CLI ganhou olhos de IDE GitHub mostrou uma skill de LSP para o Copilot CLI: instala e configura language servers para 14 linguagens, com go-to-definition e tipos resolvidos em vez de grep em ficheiros.
💡 Porque importa Para coding agents, contexto semântico vale tanto como mais tokens. Menos adivinhação sobre APIs, menos voltas ao node_modules.
☕ Conversa de café Se o terminal já sabe fazer go-to-definition, ainda chamamos isto CLI?