1️⃣ Copilot começou a poupar contexto antes de gastar créditos GitHub explicou como o Copilot em VS Code está a usar prompt caching, tool search e Auto para mandar menos contexto inútil para o modelo. A mudança chega num momento sensível: Copilot passou a medir muita coisa em AI Credits.
💡 Porque importa Para equipas que usam agents no IDE, custo já não é só modelo escolhido. É contexto, ferramentas carregadas, cache partida e sessões demasiado longas.
☕ Conversa de café Quantos workflows ainda estão a pagar para o modelo ler ferramentas que nem vai chamar?
2️⃣ GLM-5.2 trouxe 1 milhão de tokens para coding agents abertos Z.ai lançou o GLM-5.2 para tarefas longas, com contexto de 1 milhão de tokens, licença MIT e foco explícito em coding agents. A Artificial Analysis colocou-o na fronteira entre inteligência e custo entre modelos open-weight.
💡 Porque importa O teste real não é aceitar um repositório inteiro. É aguentar horas de mudanças, debugging e tool use sem perder o fio ou rebentar o orçamento.
☕ Conversa de café Se um modelo aberto já aguenta a sessão longa, que parte da stack ainda prende a equipa ao fornecedor?
3️⃣ MosaicLeaks mostrou como agentes de pesquisa podem denunciar segredos ServiceNow e Hugging Face publicaram o MosaicLeaks, um benchmark com 1.001 tarefas multi-hop que mistura documentos privados e web. O problema: as pesquisas externas do agent podem revelar informação interna mesmo sem enviar o documento.
💡 Porque importa RAG e deep research precisam de política para queries de saída, não só para prompts e respostas. Um log de pesquisa também pode ser fuga de dados.
☕ Conversa de café Quem está a rever as pesquisas que o agent faz quando lê documentos internos?