ElevenLabs : l’application Reader révolutionne la synthèse vocale
ElevenLabs dévoile son application Reader révolutionnaire pour la synthèse vocale
La startup ElevenLabs, pionnière dans le développement d’outils d’intelligence artificielle pour la création et l’édition de voix synthétiques, vient de lancer son application Reader dans le monde entier, avec la prise en charge de 32 langues. Un véritable atout pour rendre le contenu audio plus accessible que jamais.
Une application qui donne vie au texte
Disponible depuis juin aux États-Unis, au Royaume-Uni et au Canada, l’application Reader permet aux utilisateurs de télécharger n’importe quel contenu textuel – articles, documents PDF ou livres numériques – et de l’écouter dans différentes langues et voix. Grâce à cette mise à jour, Reader prend désormais en charge des langues aussi variées que le portugais, l’espagnol, le français, l’hindi, l’allemand, le japonais, l’arabe, le coréen, l’italien, le tamoul et le suédois.
Une technologie au service de nombreux partenaires
Récemment valorisée à plus d’un milliard de dollars après une levée de fonds de 80 millions auprès d’investisseurs de renom comme Andreessen Horowitz, ElevenLabs fournit une API que les entreprises peuvent utiliser pour diverses applications, comme le doublage ou la conversion texte-parole. La société alimente ainsi les interactions vocales sur le Rabbit r1, ainsi que les fonctionnalités de synthèse vocale sur le moteur de recherche alimenté par l’IA Perplexity et les plateformes audio Pocket FM et Kuku FM. L’application Reader est son premier produit grand public.
Une bibliothèque de voix toujours plus riche
ElevenLabs a ajouté des centaines de nouvelles voix issues de sa bibliothèque, parfaitement adaptées aux différentes langues prises en charge. Le mois dernier, l’entreprise a même acquis les droits pour utiliser les voix d’acteurs célèbres tels que Judy Garland, James Dean, Burt Reynolds et Sir Laurence Olivier dans son application.
Cette extension linguistique repose sur le modèle Turbo v2.5 d’ElevenLabs, lancé le mois dernier, qui réduit prétendument la latence de la conversion texte-parole et en améliore la qualité.
Une concurrence féroce mais des atouts solides
La principale concurrente de Reader est Speechify, qui propose des fonctionnalités supplémentaires comme la numérisation de documents, des intégrations avec Gmail et Canvas, ainsi que la possibilité de cloner sa propre voix pour lire du texte. Les applications audio de Mozilla Pocket et du New York Times (basée sur Audm) permettent également aux utilisateurs d’écouter du contenu.
Cependant, avec sa technologie de pointe, sa bibliothèque de voix en constante expansion et son modèle Turbo v2.5 performant, ElevenLabs semble bien positionnée pour se tailler une place de choix sur ce marché en pleine croissance.
Des défis éthiques à relever
Bien que prometteuse, la technologie de synthèse vocale soulève également des enjeux éthiques importants. Les préoccupations liées à la protection de la vie privée et aux droits d’auteur, ainsi que les risques de deepfakes et de désinformation, sont autant de défis à relever pour une utilisation responsable de cette innovation.
ElevenLabs affirme travailler activement sur ces questions et mettre en place des initiatives visant à encadrer l’utilisation éthique de sa technologie.
Un avenir prometteur pour l’audio intelligent
Avec le lancement de nouvelles fonctionnalités en développement, comme le support hors ligne et la possibilité de partager des extraits audio, l’application Reader ne cesse de s’enrichir. ElevenLabs ambitionne de devenir un leader incontournable dans le domaine de l’IA vocale, avec un impact potentiel majeur sur les industries du divertissement, de l’éducation et de la communication.
Grâce à des innovations comme celles d’ElevenLabs, l’audio intelligent semble promis à un avenir radieux, offrant de nouvelles façons de consommer et d’interagir avec le contenu numérique.