O fast mode do Claude Opus 4.8 está agora em preview no GitHub Copilot, anunciado no changelog do GitHub a 29/06/2026. É o mesmo modelo que o Claude Opus 4.8 padrão - a mesma inteligência, a mesma qualidade - afinado para uma saída bastante mais rápida, disponível nos planos Copilot pagos.
O que é o fast mode
O fast mode não é um modelo diferente e menos capaz. É o Claude Opus 4.8 otimizado para a velocidade dos tokens de saída: obtém respostas muito mais rápidas com a mesma inteligência e qualidade do modelo padrão. O Claude Opus 4.8 padrão está disponível de forma geral no GitHub Copilot desde 28/05/2026; esta preview apenas acrescenta a variante otimizada para a velocidade. Se já usou o Opus 4.8 padrão, o fast mode deve dar respostas idênticas - apenas mais depressa.
A distinção importa, porque velocidade e capacidade são habitualmente apresentadas como um compromisso - um modelo "mais pequeno e mais rápido" é normalmente menos capaz. Aqui não é o caso: a inteligência é a mesma, muda apenas a velocidade de entrega. A pergunta já não é "aceito respostas piores para ir mais depressa?", mas simplesmente "o custo adicional por token compensa a menor latência para esta tarefa?".
Quem tem acesso
Segundo o changelog do GitHub, o fast mode está disponível em:
- Copilot Pro+
- Copilot Max
- Copilot Business
- Copilot Enterprise
Nos planos Business e Enterprise, um administrador tem de ativar a política de fast mode nas definições do Copilot antes de aparecer para os programadores. A distribuição é gradual: pode, por isso, não constar no seu seletor de modelos no momento em que lê estas linhas.
O preço, com honestidade
O fast mode é faturado a:
- 10 $ por milhão de tokens de entrada
- 50 $ por milhão de tokens de saída
A Anthropic indica que este fast mode é cerca de 2,5x mais rápido e cerca de 3x mais barato do que o fast mode dos modelos anteriores. É uma melhoria clara face à economia do antigo fast mode. Mas leia com atenção: o fast mode continua a custar mais por token do que o Claude Opus 4.8 padrão. É um compromisso entre velocidade e custo, não um desconto geral - paga um suplemento para reduzir a latência.
Quando escolher fast em vez de padrão
Como a inteligência é idêntica, a decisão resume-se à latência face ao custo:
- Use o fast mode para programação interativa e agêntica onde a espera penaliza - edições inline rápidas, ciclos de feedback curtos, execuções de agente em que a velocidade de saída é o estrangulamento.
- Use o Opus 4.8 padrão para trabalho não sensível à latência - tarefas em lote, geração em segundo plano, ou qualquer caso em que uns segundos a mais não têm importância - porque continua mais barato por token.
É na programação agêntica que a diferença de velocidade mais se nota. Quando um agente executa uma tarefa em vários passos - ler ficheiros, planear, editar e depois voltar a verificar -, cada passo aguarda a saída do modelo, e essas esperas acumulam-se ao longo de toda uma sessão. Ganhar latência em cada passo pode transformar uma execução de agente lenta numa que acompanha o seu ritmo. Para uma pergunta pontual ou um job em segundo plano, essa vantagem desaparece em grande parte, e o modelo padrão mais barato torna-se a escolha predefinida sensata.
Se está a comparar o Copilot com outras ferramentas, veja Cursor vs GitHub Copilot e o nosso dossiê alternativas ao GitHub Copilot.
Como ativá-lo
- Certifique-se de que está num plano compatível (Pro+, Max, Business ou Enterprise).
- Nos planos Business ou Enterprise, peça a um administrador para ativar a política de fast mode nas definições do Copilot.
- Abra o seletor de modelos do Copilot e selecione Claude Opus 4.8 fast mode.
- Se ainda não o vir, é normal - a distribuição é gradual.
Conclusão
O fast mode do Claude Opus 4.8 dá aos utilizadores do GitHub Copilot nos planos pagos a mesma qualidade Opus 4.8 a uma velocidade bastante superior, a 10 $/M de entrada e 50 $/M de saída - cerca de 2,5x mais rápido e cerca de 3x mais barato do que o fast mode anterior, mas ainda mais caro por token do que o Opus 4.8 padrão. Recorra a ele quando a latência for a restrição; fique no padrão quando o custo por token pesar mais do que a velocidade.
Se está a comparar ferramentas ao estilo agente e workflows em terminal a par do Copilot, leia Cursor vs Claude Code e a nossa panorâmica melhores assistentes de programação com IA 2026.


