C'est pas mon idée !: Synthesia produit des avatars expressifs

mercredi 1 mai 2024

Synthesia produit des avatars expressifs

Loin des fantasmes suscités par les exagérations médiatiques autour de l'intelligence artificielle générative, Synthesia en propose une application simple, pratique et opérationnelle, susceptible d'être mise en œuvre par toutes les entreprises recherchant des moyens efficaces de communiquer en vidéo, avec leurs employés ou leurs clients.

J'ai déjà évoqué ici quelques tentatives d'introduire un simulacre d'empathie, matérialisée par une réaction faciale aux émotions exprimées par l'internaute, dans les avatars utilisés en guise de façade aux robots conversationnels. La cible de Synthesia est radicalement différente puisqu'elle concerne exclusivement la création de films incarnés par des personnages virtuels aux comportements aussi naturels que des comédiens professionnels, sans requérir de talents de direction d'acteurs.

Aussi facile à appréhender que PowerPoint, la plate-forme permet de composer et mettre en scène visuellement un scénario. Chaque scène peut inclure du texte, diverses formes, des éléments multimédias et, bien sûr, un avatar – à choisir parmi une vaste collection d'identités prédéfinies ou à dessiner, par exemple à partir d'une capture d'une personne en chair et en os –, dont il suffit de rédiger le texte qu'il doit prononcer – avec, là encore, une voix sélectionnée dans la libraire proposée – afin de l'animer.

Outre la désormais classique synchronisation des lèvres avec les paroles articulées, dans toutes les langues supportées (y compris par traduction automatique, le cas échéant), la nouvelle version de l'outil est maintenant en mesure d'adapter les expressions du visage à la tonalité du script fourni (joie, tristesse, enthousiasme…) avec un réalisme époustouflant, résultat d'un entraînement des modèles sous-jacents sur des enregistrements (avec des cobayes humains) dédiés à cet objectif.

Entièrement synthétisées par les IA propriétaires de Synthesia, les vidéos sont produites en temps réel, permettant au concepteur d'ajuster les paramètres à la volée pour atteindre rapidement le résultat désiré. Et si, pour l'instant, les avatars sont essentiellement réduits à une tête, la jeune pousse travaille à une évolution vers des représentations en trois dimensions de protagonistes en pied, capables de se mouvoir dans l'environnement qui leur est alloué et de compléter de la sorte leur communication corporelle (notamment via les mains, particulièrement difficiles à gérer, paraît-il).

La solution s'adresse aux entreprises qui savent que la transmission d'information et l'apprentissage sont plus efficaces quand ils sont portés par des intervenants humains mais qui n'ont pas les moyens de produire un film traditionnel dans toutes les circonstances où il aurait du sens. Les principaux cas d'usage visés touchent ainsi aux supports d'auto-formation (pour les ressources humaines, les équipes de vente, les départements informatiques…) et aux modules d'assistance en libre service (pour les guides d'utilisation ou les bases de connaissance du SAV, entre autres).

Pour les organisations, tellement nombreuses dans le secteur financier, qui hésitent – probablement à juste titre bien que leur prudence soit parfois excessive – à déployer des applications d'intelligence artificielle générative par crainte d'anomalies et d'hallucinations échappant malencontreusement à leur contrôle, l'offre de Synthesia représente une implémentation sans danger : la responsabilité des contenus restitués par la plate-forme, au demeurant peu exposés aux erreurs, reste entre leurs mains.

Aucun commentaire:

Enregistrer un commentaire

Afin de lutter contre le spam, les commentaires ne sont ouverts qu'aux personnes identifiées et sont soumis à modération (je suis sincèrement désolé pour le désagrément causé…)