Annoncé en mai, puis mystérieusement repoussé, le nouveau ChatGPT capable d’entretenir de longues conversations vocales, en acceptant d’être coupé et en imitant des émotions, arrive en version alpha. De premiers chanceux peuvent déjà l’essayer.

Un ChatGPT capable de discuter avec une voix naturelle, d’être interrompu en pleine phrase, de changer d’émotion, de chanter et de répondre sans aucun délai… Voilà la promesse d’OpenAI avec le nouveau mode voix de son agent conversationnel, dévoilé en mai 2024, en même temps que GPT-4o. Le nouveau ChatGPT Voice, pris dans des polémiques (notamment le plagiat de la voix de Scarlett Johansson), a ensuite été repoussé, sans date de lancement officielle.

Sur Twitter le 30 juillet, OpenAI a annoncé que de premiers abonnés à son offre payante, ChatGPT Plus, pouvaient désormais converser avec l’assistant vocal. D’ici la fin de l’automne, ChatGPT Voice sera déployé chez tous les utilisateurs payants (rien n’a été dit pour les utilisateurs gratuits).

OpenAI a annoncé le déploiement de sa nouvelle fonction sur Twitter.
OpenAI a annoncé le déploiement de sa nouvelle fonction sur Twitter. // Source : X

OpenAI dit avoir pris plusieurs mesures de sécurité

Combien de personnes ont accès au nouveau ChatGPT Voice ? Difficile de le dire pour l’instant, alors qu’OpenAI parle d’une version « alpha » réservée à des heureux élus informés par mail. Certaines fonctions emblématiques, comme la possibilité pour ChatGPT d’accéder au flux vidéo de votre caméra ou à l’écran de votre smartphone, ne sont pas encore disponibles.

Dans un thread Twitter repris par plusieurs cadres d’OpenAI, l’entreprise dit avoir « renforcé la sécurité et la qualité des conversations vocales » depuis son annonce. OpenAI indique aussi avoir travaillé avec plusieurs experts indépendants pour s’assurer que son produit n’allait pas trop loin, alors que les limites entre l’IA et l’humain n’ont jamais été si proches.

Début août, OpenAI publiera un document sur les capacités de son assistant vocal, après analyse des conversations des premiers testeurs. À terme, le géant de l’IA espère révolutionner l’industrie des assistants avec son produit capable de tenir de longues conversations cohérentes, dignes du film Her. Le français Kyutai, avec son assistant vocal Moshi, mise aussi sur l’audio en temps réel pour faire de l’IA générative un produit incontournable.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Marre des réseaux sociaux ? Rejoignez-nous sur WhatsApp !