Sur Internet, une nouvelle application d’intelligence artificiel fait parler d’elle depuis quelques jours : elle permet de doubler automatiquement, dans une autre langue, des personnages en vidéo, avec un réalisme extrême, jusqu’au mouvement des lèvres. De quoi brouiller encore un peu plus les limites entre le vrai et le faux, et nous pousser à nous interroger sur les contenus numériques que nous voyons
Sur Internet, circule un discours de Donald Trump dans un français presque parfait. De quoi étonner n’importe quel téléspectateur ne prenant pas un peu garde. Car c’est une vidéo a passé dans un nouveau logiciel de traduction instantanée des contenus vidéos. Et le résultat est totalement bluffant, synchronisation du mouvement des lèvres et même recréation de l’intonation de la voix en primes.
Démonstration simple: j’ai enregistré une petite vidéo. Je ne parle pas un mot de polonais, mais grâce à la machine, je peux faire une démonstration que c’est possible d’obtenir simplement un doublage crédible de ma voie en polonais. Trois simples clics après avoir inséré la vidéo dans l’application, et le résultat est des plus surprenant: ma vidéo contient ma voix, mon intonation, mais dans un polonais tout à fait honorable, selon les commentaires que j’ai reçu de certains amis parlant cette langue.
Internet fourmille d’exemples
Des dizaines d’exemples, tous bluffants, circulent déjà sur Internet, comme Lionel Messi s’exprimant en anglais, alors que le footballeur n’est pas connu pour parler bien dans la langue de Shakespeare. Ou le général de Gaulle tenant un discours en portugais.
Pour Sabine Süsstrunk, professeure au Laboratoire images et représentation visuelle à l’EPFL, c’est parce que nous ne sommes pas habitués à cette technologie, encore très nouvelle, qu’on tombe facilement dans le panneau. Même si le système a encore des limites, souligne-t-elle: « Chaque langue a des spécificités, justement de l’humour, du deuxième degré, des jeux de mots, qui sont très difficile à traduire dans une autre langue. Jusqu’à maintenant, l’intelligence artificielle ne peut pas faire cela. Ayant dit cela, ce qui n’est pas possible aujourd’hui, va être possible demain. »
Pas la peine, pour autant, de se réjouir trop vite pour celles et ceux qui souhaiteraient exploiter cette technologie pour doubler leurs vidéos, car un constat demeure, comme la précise l’experte des images falsifiées: « Ces images restent des images truquées. Donc si on prend un politicien qui parle le français, mais sur un site web, il parle allemand ou italien, on va justement assumer qu’il parle ces langues. C’est peut-être facile pour la communication, mais cela ne l’aide pas, car après, les gens ont l’attente que cette personne parle ces langues. »
Une technologie qui, une nouvelle fois, joue sur notre crédulité et nécessitera qu’on apprenne à la décrypter.