L’OCR, pour reconnaissance optique de caractères, est une technologie relativement commune dans les produits modernes. C’est grâce à elle qu’un iPhone peut extraire du texte d’une capture d’écran ou que les terminaux Android peuvent faire une recherche à partir d’une image.
Pendant longtemps, l’OCR était inaccessible. Il fallait acheter des logiciels spécialisés pour extraire du texte d’un scanner ou d’une photo. L’émergence de l’IA générative a changé la donne : ChatGPT, Gemini, Grok ou Le Chat embarquent des capacités multimodales qui leur permettent d’extraire du texte d’une image en quelques secondes. On peut même convertir du texte écrit à la main en texte numérique.
Le 6 mars 2025, le français Mistral AI a annoncé avoir franchi une nouvelle étape dans la reconnaissance de texte. Il lance Mistral OCR, une technologie développée en interne, présentée comme la plus performante du marché.
Une bonne analyse de la forme d’un texte : Mistral ajoute de l’IA à l’OCR
La différence entre Mistral OCR et ses concurrents est que le service français ne se contente pas d’extraire du texte. Mistral l’a entraîné pour comprendre la hiérarchie d’un document. Mistral OCR sait reconnaître les titres, les images, les tableaux et les équations, et ne les dénature pas une fois extraits. Il replace tout dans le bon ordre, là où un document créé par ChatGPT pourrait nécessiter un peu de réécriture humaine.
Les démonstrations partagées par Mistral sont très encourageantes. Les documents générés par Mistral OCR sont conformes aux images originales, avec une extraction parfaite des images au bon endroit. Mistral OCR gère plusieurs langues et les formules mathématiques, sans défaut de recopie a priori.
Pour prouver que son modèle est le meilleur au monde, Mistral partage les résultats de plusieurs benchmarks. En moyenne, Mistral OCR affiche une réussite dans 94,89 % des cas. C’est mieux que GPT-4o (89,77 %) et Google Gemini (entre 88 et 90,23 %, en fonction du modèle). Mistral est le meilleur dans toutes les catégories testées, avec une précision quasiment absolue sur les documents scannés (98,96 % de réussite). Il est aussi le meilleur dans la plupart des langues.
Il y a néanmoins un support non évoqué par Mistral : l’écriture manuscrite. ChatGPT, sur cet aspect précis, s’en sort très bien. Il faut généralement repasser par dessus, notamment pour corriger des erreurs de compréhension, mais c’est beaucoup mieux qu’avec d’autres services. Mistral ne dit pas si sa technologie d’OCR est entraînée pour ça.

Mistral OCR est disponible gratuitement dans Le Chat, le chatbot français. Une API est également disponible pour les développeurs qui souhaiteraient seulement utiliser la technologie d’extraction de texte.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !