alexi.sh
Todos os artigosSegurança do navegadorPrivacidade de redeFerramentas de privacidadeModelagem de ameaçasProgramação com IAFerramentas de dev

alexi.shLaboratório de Engenharia de IA

ai-coding

Mistral Leanstral 1.5: a IA de código aberto que prova código e matemática corretos

PrivSec Lab4 min de leitura
Uma mão a escrever equações de cálculo com giz num quadro-negro

A Mistral lançou o Leanstral 1.5, um modelo gratuito Apache-2.0 para Lean 4 que prova formalmente a correção de matemática e código. O que é a verificação formal, os números de benchmark que a Mistral afirma e onde o modelo realmente encaixa para programadores.

A Mistral lançou o Leanstral 1.5, um modelo de IA de código aberto e gratuito que faz algo invulgar: ajuda a provar código e matemática corretos. A maioria dos assistentes de programação gera código e espera que funcione. O Leanstral 1.5 funciona dentro do Lean 4, um assistente de prova, onde cada passo é verificado. Segundo a Mistral, foi lançado a 30 de junho de 2026 sob a licença Apache-2.0. Aqui fica o que é, os números que a Mistral afirma e onde realmente encaixa. Para o campo mais amplo, veja a nossa visão geral dos melhores LLM de programação 2026.

O que é o Leanstral 1.5

Segundo a Mistral, o Leanstral 1.5 é um modelo de agente de código construído para Lean 4. O Lean 4 é um assistente de prova. Consegue exprimir objetos matemáticos complexos e também especificações de software, como propriedades de fragmentos de código Rust.

A Mistral diz que o modelo funciona como um programador num sistema de ficheiros real. Edita ficheiros, executa comandos bash e usa o servidor de linguagem do Lean. Isso permite-lhe assumir tarefas longas: completar uma prova parcial num repositório, construir lemas auxiliares e avançar através de muitas rondas de contexto.

Quanto aos números, a Mistral descreve um modelo de mistura de especialistas com 119 mil milhões de parâmetros totais e cerca de 6,5 mil milhões ativos por token. Tem uma janela de contexto de 256k tokens. Está na Hugging Face como mistralai/Leanstral-1.5-119B-A6B, com uma API gratuita. Se executa modelos localmente, o nosso guia melhor LLM local para programação dá o contexto mais amplo.

O que a verificação formal significa para os programadores

Esta é a parte que importa, por isso aqui fica de forma clara. O teste verifica o seu código em algumas entradas. A verificação formal prova que está correto para todas as entradas, usando a matemática. Um assistente de prova como o Lean 4 verifica cada passo lógico. Se a prova passa, é uma garantia, não uma amostra.

Esse poder tem um custo. Escrever provas formais à mão é lento e difícil, e é por isso que a maior parte do software nunca é verificado. A esperança por trás de um modelo como o Leanstral é tornar esse trabalho mais rápido e mais acessível. Está mais perto de uma ferramenta de revisão de código por IA para a correção do que de um chatbot.

Linhas coloridas de código-fonte de programação num ecrã escuro

As afirmações de benchmark

A Mistral reporta resultados de benchmark fortes. Trate-os como os números do próprio fornecedor até que outros os reproduzam.

Segundo a Mistral, o Leanstral 1.5 satura o miniF2F e resolve 587 de 672 problemas do PutnamBench. A Mistral também afirma resultados de topo no FATE-H com 87% e no FATE-X com 34%. No FLTEval, a Mistral diz que o pass@1 sobe de 21,9 para 28,9, e o pass@8 sobe de 31,9 para 43,2.

Estes são benchmarks de prova, não testes gerais de programação. Uma pontuação alta no PutnamBench significa que o modelo é bom em matemática formal difícil. Não significa que vai escrever a sua aplicação web. Leia os números pelo que medem.

O que isto significa para si

Para a maioria dos programadores, o Leanstral 1.5 não é uma ferramenta do dia a dia hoje. É uma ferramenta especializada para Lean 4 e provas formais. Se não escreve provas, não vai mudar o seu fluxo de trabalho esta semana.

Mas a direção vale a pena acompanhar. Um modelo de código aberto orientado para a correção demonstrável é uma aposta diferente da habitual corrida à conclusão de código. Com o tempo, uma verificação formal mais barata poderia chegar a mais do código que realmente precisa dela: criptografia, aeroespacial, finanças e contratos inteligentes. Se as provas assistidas por IA ficarem boas e baratas, o "testado" pode ceder lentamente lugar ao "provado" para o código de mais alto risco.

As ressalvas honestas

Duas ressalvas mantêm isto com os pés na terra. Primeiro, os números de benchmark são as próprias afirmações da Mistral, publicadas com o lançamento. São promissores, mas é a reprodução independente que transforma uma afirmação num facto. Segundo, esta é uma ferramenta restrita. O Lean 4 tem uma curva de aprendizagem acentuada, e a verificação formal ainda é um trabalho de nicho, não algo que a maioria das equipas faz.

A leitura honesta: o Leanstral 1.5 é um passo real, gratuito e capaz para um problema difícil, lançado abertamente para que qualquer pessoa o possa testar. Essa abertura é a parte mais forte da história. Se a correção demonstrável importa para o seu trabalho, vale a pena dar uma olhada. Se não, fique de olho no espaço e mantenha-se com as ferramentas do nosso apanhado dos melhores assistentes de programação por IA.

Photo: Pexels (source)

Também disponível em

FAQ

O que é o Mistral Leanstral 1.5?
Segundo a Mistral, o Leanstral 1.5 é um modelo de IA de código aberto para Lean 4, um assistente de prova. Ajuda a escrever e a verificar provas formais tanto de matemática como da correção de programas. A Mistral lançou-o a 30 de junho de 2026 sob a licença Apache-2.0, e está disponível na Hugging Face e através de uma API gratuita.
O Leanstral 1.5 é gratuito e de código aberto?
Sim. Segundo a Mistral, o Leanstral 1.5 é lançado sob a licença Apache-2.0, que é uma licença de código aberto permissiva. Os pesos do modelo estão na Hugging Face como mistralai/Leanstral-1.5-119B-A6B, e a Mistral também oferece uma API gratuita e acesso no Mistral Labs.
Qual é o tamanho do Leanstral 1.5?
Segundo a Mistral, o Leanstral 1.5 usa um design de mistura de especialistas (MoE) com 119 mil milhões de parâmetros totais e cerca de 6,5 mil milhões ativos por token. Tem uma janela de contexto de 256k tokens, o que lhe permite manter ficheiros de prova longos e o código relacionado ao mesmo tempo.
O que é a verificação formal e por que é que importa?
A verificação formal usa a matemática para provar que um código ou um teorema está correto, não apenas para o testar em algumas entradas. Um assistente de prova como o Lean 4 verifica cada passo, por isso uma prova que passa é uma garantia, não uma amostra. Importa sobretudo para código de alto risco, mas é difícil e lento, e é por isso que a ajuda da IA desperta interesse.