1️⃣ OpenAI entrou no procurement da AWS OpenAI pôs GPT-5.5, GPT-5.4 e Codex em disponibilidade geral no Amazon Bedrock. Codex pode correr pela app, CLI e IDEs, com inferência roteada pelo Bedrock e controlos AWS.
💡 Porque importa Para empresas que já vivem em AWS, isto reduz atrito de segurança, compras e billing. A escolha de modelo passa a caber no mesmo stack cloud.
☕ Conversa de café Quantas equipas queriam OpenAI, mas estavam presas mais ao procurement do que ao modelo?
2️⃣ Copilot começou a cobrar pelo peso real do trabalho Desde 1 de junho, todos os planos GitHub Copilot usam AI Credits. Code review também consome minutos de GitHub Actions, e organizações ganharam budgets por utilizador.
💡 Porque importa Os agentes de código deixaram de custar o mesmo que uma pergunta curta. Equipas vão ter de medir uso, limitar sessões longas e explicar a fatura.
☕ Conversa de café Quem ainda trata agent mode como autocomplete vai descobrir isso no budget ou no pull request?
3️⃣ JetBrains abriu um modelo pequeno para tarefas repetidas JetBrains lançou o Mellum2, um MoE open-weight de 12B parâmetros, com 2.5B ativos por token, licença Apache 2.0 e foco em texto, código, routing, RAG e subagentes.
💡 Porque importa Nem todo passo de um produto AI precisa de frontier model. Routing, validação e sumarização são chamadas frequentes, onde latência e custo mandam.
☕ Conversa de café Para quantas equipas o ganho não está no modelo maior, mas no modelo barato que responde mil vezes por minuto?