Avec 288 langues au compteur, Wikipédia est indéniablement l'encyclopédie multilingue la plus ambitieuse jamais réalisée. Toutefois, le développement de chaque déclinaison linguistique du site est loin d'être aussi abouti que la version anglophone et ses 4,7 millions d'articles. Certaines éditions de Wikipédia ne comptent que quelques pages, du fait du faible nombre de locuteurs impliqués dans le projet.
Afin de faciliter les échanges entre les différentes versions de l'encyclopédie, la fondation Wikimédia travaille depuis 2014 sur un outil permettant de traduire automatiquement des sujets d'une langue à l'autre tout en conservant la mise en forme générale ainsi que les éléments qui peuvent s'avérer fastidieux à insérer (liens internes, liens externes, articles connexes…).
Après quelques étapes préliminaires, l'outil est désormais sur le point d'entrer dans une phase beta. De ce fait, celui-ci sera en mesure de supporter plusieurs nouvelles langues : le catalan, le danois, l'espéranto, l'indonésien, le malais, le bokmål (variante du norvégien), le portugais et l'espagnol. Certaines d'entre elles (catalan et espagnol) étaient déjà supportées dans de précédentes versions.
La traduction est opérée par Apertium, un logiciel de traduction automatique basé sur des dictionnaires et des règles de transfert développé initialement par l'université d'Alicante. C'est un logiciel libre distribué selon les termes de la licence GNU GPL 2.0, précise l'article Wikipédia qui lui est consacré.
Comment ça marche ?
Une fois connecté à Wikipédia, il faut se rendre sur une déclinaison linguistique de l'encyclopédie qui est actuellement prise en compte. Là, un outil de traduction est disponible dans la page d'utilisateur à la rubrique contribution. Il faut alors sélectionner un article qui n'existe pas dans votre langue (en fait, celle de la langue de la version Wikipédia sur laquelle vous vous trouvez) et lancer la traduction.
Bien sûr, toute traduction automatique a ses limites. Si les outils s'améliorent année après année, les usagers devront quand même vérifier la qualité du résultat et retoucher ici et là les erreurs d'adaptation. L'avantage de ce système est en tout cas de permettre aux usagers de se concentrer sur le texte et de ne pas perdre trop de temps avec la mise en forme de l'article.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !