Mistral ha rilasciato Leanstral 1.5, un modello IA gratuito e open source che fa qualcosa di insolito: aiuta a dimostrare la correttezza di codice e matematica. La maggior parte degli assistenti di programmazione genera codice e spera che funzioni. Leanstral 1.5 lavora dentro Lean 4, un assistente di dimostrazione, dove ogni passaggio viene verificato. Secondo Mistral, è stato lanciato il 30 giugno 2026 con licenza Apache-2.0. Ecco cos'è, i numeri dichiarati da Mistral e dove si colloca davvero. Per una panoramica più ampia del settore, vedi la nostra guida ai migliori LLM per la programmazione 2026.
Cos'è Leanstral 1.5
Secondo Mistral, Leanstral 1.5 è un modello ad agente di codice costruito per Lean 4. Lean 4 è un assistente di dimostrazione. Può esprimere oggetti matematici complessi e anche specifiche software, come le proprietà di frammenti di codice Rust.
Mistral afferma che il modello lavora come uno sviluppatore in un vero filesystem. Modifica file, esegue comandi bash e usa il language server di Lean. Questo gli permette di affrontare compiti lunghi: completare una dimostrazione parziale in un repository, costruire lemmi ausiliari e portare avanti molti cicli di contesto.
Sui numeri, Mistral descrive un modello mixture-of-experts con 119 miliardi di parametri totali e circa 6,5 miliardi attivi per token. Ha una finestra di contesto da 256k token. È su Hugging Face come mistralai/Leanstral-1.5-119B-A6B, con un'API gratuita. Se esegui i modelli in locale, la nostra guida al miglior LLM locale per la programmazione fornisce il contesto più ampio.
Cosa significa la verifica formale per gli sviluppatori
Questa è la parte che conta, quindi eccola in parole semplici. Il test verifica il tuo codice su alcuni input. La verifica formale dimostra che è corretto per tutti gli input, usando la matematica. Un assistente di dimostrazione come Lean 4 verifica ogni passaggio logico. Se la dimostrazione passa, è una garanzia, non un campione.
Questa potenza ha un costo. Scrivere dimostrazioni formali a mano è lento e difficile, ed è per questo che la maggior parte del software non viene mai verificata. La speranza dietro un modello come Leanstral è rendere quel lavoro più veloce e più accessibile. È più vicino a uno strumento di revisione del codice con l'IA per la correttezza che a un chatbot.

Le dichiarazioni sui benchmark
Mistral riporta risultati solidi sui benchmark. Considerali come numeri del fornitore stesso finché altri non li riproducono.
Secondo Mistral, Leanstral 1.5 satura miniF2F e risolve 587 problemi su 672 di PutnamBench. Mistral dichiara anche risultati allo stato dell'arte su FATE-H all'87% e su FATE-X al 34%. Su FLTEval, Mistral afferma che pass@1 sale da 21,9 a 28,9 e pass@8 sale da 31,9 a 43,2.
Questi sono benchmark di dimostrazione, non test di programmazione generale. Un punteggio elevato su PutnamBench significa che il modello è bravo nella matematica formale difficile. Non significa che scriverà la tua web app. Leggi i numeri per ciò che misurano.
Cosa significa per te
Per la maggior parte degli sviluppatori, Leanstral 1.5 non è uno strumento di uso quotidiano oggi. È uno strumento specialistico per Lean 4 e le dimostrazioni formali. Se non scrivi dimostrazioni, non cambierà il tuo flusso di lavoro questa settimana.
Ma la direzione merita attenzione. Un modello open source rivolto alla correttezza dimostrabile è una scommessa diversa dalla solita corsa al completamento del codice. Col tempo, una verifica formale più economica potrebbe raggiungere una parte maggiore del codice che ne ha davvero bisogno: crittografia, aerospazio, finanza e smart contract. Se le dimostrazioni assistite dall'IA diventano buone ed economiche, il "testato" potrebbe lentamente cedere il passo al "dimostrato" per il codice a più alto rischio.
Le doverose avvertenze
Due avvertenze mantengono tutto con i piedi per terra. Primo, i numeri dei benchmark sono dichiarazioni di Mistral stessa, pubblicate con il rilascio. Sono promettenti, ma è la riproduzione indipendente a trasformare una dichiarazione in un fatto. Secondo, questo è uno strumento di nicchia. Lean 4 ha una curva di apprendimento ripida, e la verifica formale è ancora un lavoro di nicchia, non qualcosa che la maggior parte dei team fa.
La lettura onesta: Leanstral 1.5 è un passo reale, gratuito e capace per un problema difficile, rilasciato apertamente così che chiunque possa testarlo. Questa apertura è la parte più forte della storia. Se la correttezza dimostrabile conta per il tuo lavoro, vale la pena dargli un'occhiata. Se non conta, tieni d'occhio il settore e resta sugli strumenti della nostra selezione dei migliori assistenti di programmazione IA.



