Google dévoile Gemini Live, son assistant IA conversationnel en mode vocal

Published On: août 13, 2024//Categories: News//2 min read//444 words//
717a0a73 85fa 4b7a add9 6e169c5dafb4

Google dévoile Gemini Live, un mode de discussion vocale naturelle pour son assistant IA

Lors de son événement Pixel 9 aujourd’hui, Google a annoncé le lancement de Gemini Live, un nouveau mode de discussion vocale pour son assistant virtuel Gemini. Disponible pour les abonnés Gemini Advanced, cette fonctionnalité fonctionne un peu comme le chat vocal de ChatGPT, avec la possibilité de choisir parmi plusieurs voix synthétiques et d’avoir une conversation fluide, au point même de pouvoir interrompre l’assistant sans appuyer sur un bouton.

Des échanges vocaux naturels et spontanés

Selon Google, les conversations avec Gemini Live peuvent être « naturelles et spontanées ». Vous pouvez par exemple interrompre une réponse à mi-phrase ou faire une pause dans la discussion et la reprendre plus tard. Gemini Live fonctionnera également en arrière-plan ou lorsque votre téléphone est verrouillé. Cette fonctionnalité avait été annoncée pour la première fois lors de la conférence des développeurs Google I/O plus tôt cette année, où il avait également été précisé que Gemini Live serait capable d’interpréter des vidéos en temps réel.

Un choix parmi 10 nouvelles voix synthétiques

En plus du mode de discussion vocale, Google propose désormais 10 nouvelles voix pour son assistant Gemini, afin que les utilisateurs puissent choisir celle qui leur convient le mieux. Cette nouveauté a commencé à être déployée aujourd’hui, mais seulement en anglais pour le moment et sur les appareils Android. La firme de Mountain View indique que Gemini Live arrivera sur iOS et prendra en charge d’autres langues « dans les semaines à venir ».

Vers une expérience conversationnelle plus riche avec l’IA

Au-delà de Gemini Live, Google a également annoncé d’autres fonctionnalités pour son assistant IA, comme de nouvelles extensions à venir pour des applications tierces telles que Keep, Tasks, Utilities et YouTube Music. Gemini va aussi gagner en compréhension du contexte d’écran, de manière similaire aux fonctions d’IA présentées par Apple lors de la WWDC cette année. Après avoir appuyé sur « Poser une question sur cet écran » ou « Poser une question sur cette vidéo », Google affirme que Gemini pourra vous fournir des informations pertinentes, y compris en extrayant des détails comme des destinations à partir de vidéos de voyage pour les ajouter à Google Maps.

Avec le lancement de Gemini Live, Google vise clairement à améliorer l’expérience conversationnelle avec son assistant virtuel et à se positionner face à la concurrence d’assistants vocaux d’IA comme celui de ChatGPT. Nul doute que cette fonctionnalité évoluera encore à l’avenir, ouvrant la voie à des interactions toujours plus naturelles et contextuelles avec l’intelligence artificielle.