L’avance d’OpenAI est-elle artificielle ? Le 13 mai 2024, le créateur de ChatGPT a dévoilé un assistant vocal, capable d’imiter des voix, de comprendre des émotions, de rire ou de s’interrompre si on lui coupe la parole. Son secret : il ne transforme pas la voix en texte, mais comprend nativement la voix, ce qui le rend extrêmement rapide. Sam Altman, le patron d’OpenAI, a présenté son logiciel comme une version réelle du film Her, avec une voix sensuelle et taquine, qui transmet des émotions. Il irait même jusqu’à envisager que des gens puissent en tombent amoureux.
Plusieurs démos de cette voix ont été publiées par OpenAI, qui semble nettement en avance sur la concurrence, à commencer par Google et son projet Astra. Quand OpenAI a dévoilé ce nouveau mode voix, il avait promis que de premières personnes pourraient l’essayer « dans les prochaines semaines ». Un peu plus d’un mois plus tard, l’entreprise de Sam Altman annonce s’être trompée.
« Nous avions prévu de commencer à déployer cette fonctionnalité en version alpha auprès d’un petit groupe d’utilisateurs ChatGPT Plus à la fin du mois de juin, mais nous avons besoin d’un mois supplémentaire pour atteindre notre exigence de qualité », indique OpenAI dans un communiqué publié sur les réseaux sociaux le 25 juin.
Un test en juillet, un lancement payant cet automne pour ChatGPT Voice
En décalant le lancement du nouveau ChatGPT Voice, OpenAI prend un risque vis-à-vis de ses abonnés payants.
Depuis le lancement de GPT-4o, le modèle de langage est le même sur la version gratuite et la version payante de ChatGPT. Cela veut dire que les personnes qui payent 20 euros par mois pour ChatGPT Plus n’ont plus l’avantage de bénéficier des réponses les plus complètes, même si elles peuvent tenir des conversations plus longues avec le modèle de langage (et générer des images). OpenAI leur promettait l’arrivée rapide du nouvel assistant vocal, mais sa prédiction pour l’automne n’est pas très rassurante.
« Nous commencerons un test alpha avec un petit groupe d’utilisateurs pour recueillir des retours et élargirons en fonction de ce que nous apprenons. Nous prévoyons que tous les utilisateurs Plus y auront accès à l’automne », précise OpenAI dans son communiqué, faisant espérer à ses abonnés qu’ils seront choisis pour ce test en avant-première. La marque met en avant d’autres nouveautés à venir dans ChatGPT Plus, comme la possibilité de laisser ChatGPT voir l’écran de son ordinateur en temps réel.
Comment expliquer le report de ChatGPT Voice ?
Pour justifier son retard, OpenAI indique travailler à « améliorer l’expérience utilisateur et préparer son infrastructure pour évoluer à l’échelle de millions d’utilisateurs tout en maintenant des réponses en temps réel ». Le partenariat avec Apple, qui va ramener des centaines de millions d’utilisateurs vers ChatGPT, peut aussi jouer sur sa capacité à gérer des serveurs. L’entreprise indique aussi entraîner son assistant vocal à refuser certaines conversations, pour éviter de futures polémiques.
En parlant de polémiques, on peut aussi se demander quelles sont les conséquences de l’affaire avec Scarlett Johansson. L’actrice avait accusé OpenAI d’avoir volé sa voix, malgré son refus initial d’être la voix de l’assistant vocal. Sam Altman, le PDG d’OpenAI, avait en effet contacté l’actrice pour tenter de la convaincre de prêter sa voix à ChatGPT — en référence au film Her dans lequel Scarlett Johansson incarne le logiciel de synthèse vocale. OpenAI a finalement renoncé à cette voix, ce qui pourrait le contraindre de faire de nouveaux enregistrements. Le côté taquin et rieur de la synthèse vocale, qui mime un lien proche avec son utilisateur, a finalement peut-être incité OpenAI à plus de prudence.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.