La Wikimedia Foundation se joint à un groupe de chercheurs suédois du KTH, l’institut royal de technologie de Suède, pour développer un moteur de synthèse vocale polyglotte.
Conformément aux valeurs de la fondation, le moteur développé sera open-source et fonctionnera avec tous les sites Wikimedia. Une nouvelle étape pour démocratiser le savoir disponible sur la plateforme, ici en faveur des non-voyants ou des personnes mal voyantes.
Le défi pour les chercheurs est de créer un moteur capable de parler les plus de 300 langues présentes sur les diverses fiches de Wikipedia. Et ainsi reproduire une lecture de chacune le plus proche possible d’une voix naturelle, sans dépendre des API de synthèse vocale déjà proposées par des acteurs externes comme Microsoft ou Google (via Android).
L’intérêt est double pour la fondation et l’Internet tout entier. L’outil sera effectivement une nouvelle étape pour l’accessibilité du site, une question essentielle lorsque l’on aborde les fractures numériques dues aux handicaps. Mais par ailleurs, le projet universitaire sera aussi un projet très intéressant pour l’ensemble du web, qui pourrait en profiter au delà de Wikipédia s’il est permis d’exploiter librement le moteur pour d’autres projets.
En effet le communiqué du KTH parle d’une technologie qui sera « open source » mais ne précise pas encore la licence choisie. S’il s’agit bien d’une licence libre, et le contraire serait surprenant, il sera possible pour les développeurs d’utiliser le moteur de synthèse vocale de Wikipedia sur leurs propres sites ou applications.
Dès 2017, l’anglais, l’arabe et le suédois seront les premières langues lues par le moteur. Les autres langues suivront progressivement, peut-être avec l’aide de la communauté.
On ne peut que se féliciter de cette entreprise, qui aidera à favoriser l’accessibilité d’un Web sur lequel il est encore difficile de naviguer pour des personnes handicapées. Mais pas seulement. La PTS, l’Autorité de régulation des télécommunications suédoise, qui finance le projet, indique que plus de 25% des utilisateurs actuels de Wikipédia préféreraient entendre plutôt que lire le contenu.
Une tendance animée non seulement par les mal-voyants, mais à l’évidence aussi, par les accrocs aux podcasts et aux contenus dynamiques, qui préfèrent des contenus sonores ou vidéo à l’écrit.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !