C’est inédit pour Mistral AI. La jeune startup française spécialisée dans l’intelligence artificielle générative a partagé son tout premier modèle de langage multimodal. Son nom ? Pixtral 12B, un nom pas tout à fait choisi au hasard, puisqu’il suggère sa capacité à traiter des images (p comme picture), l’une des particularités de la multimodalité.
C’est par un message sur X (ex-Twitter) que la nouvelle a été annoncée, le 11 septembre 2024. Le message de l’entreprise peut apparaître obscur : il s’agit en fait d’un lien magnet, qui permet de récupérer un fichier torrent et lancer ensuite le téléchargement du modèle. Pour récupérer Pixtral 12B, il faut un logiciel adapté, comme QBitTorrent.
Cela fait maintenant plusieurs mois que Mistral AI a pris l’habitude de se servir de BitTorrent pour partager ses modèles de langage. Fin décembre, la société diffusait le modèle Mixtral 8x7B (87 Go). En avril, un autre modèle était partagé, Mixtral 8x22B, pour un poids de 262 Go. Ici, Pixtral 12B est presque modeste, avec ses 23,64 Go.
Un modèle bientôt utilisable en ligne
Un modèle multimodal se caractérise par sa capacité à manier des données variées, comme du texte, des images, de l’audio ou de la vidéo. Il est capable de combiner des sources diverses et les traiter en fonction du prompt de l’internaute. Par exemple, il peut décrire une image en produisant des lignes de texte. ChatGPT, par exemple, est multimodal.
Le modèle Pixtral 12B a aussi été partagé sur Hugging Face, qui recense des centaines de milliers de modèles et qui dispose d’outils permettant de les tester assez facilement — du moins, certains d’entre eux. Des précisions techniques sont également fournies pour l’installation et l’utilisation. On en trouve également sur X.
Il est notamment question d’images aux dimensions relativement petites, de 1024 par 1024 pixels de côté. À l’avenir, peut-être qu’une future itération de Pixtral pourrait traiter des visuels plus grands. Il est aussi prévu de rentrer le modèle exploitable directement sur la plateforme de Mistral AI, via une interface exploitable par des novices.
(mise à jour du dernier paragraphe pour corriger une tournure de phrase)
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !