Root NationNouvellesActualités informatiquesComme dans les films : la nouvelle IA de traitement de photos de Google fait de leur mise à l'échelle et de leur amélioration une réalité

Comme dans les films : la nouvelle IA de traitement de photos de Google fait de leur mise à l'échelle et de leur amélioration une réalité

-

Vous avez probablement vu des films fantastiques ou des émissions de télévision où le personnage principal demande d'agrandir l'image et d'améliorer le résultat - pour montrer un visage, une plaque d'immatriculation ou tout autre détail clé. Les derniers systèmes d'intelligence artificielle (IA) de Google, basés sur le soi-disant modèles de diffusion, sont capables d'effectuer cette astuce.

C'est un processus délicat à maîtriser car il s'agit essentiellement d'ajouter des détails à une image que l'appareil photo n'a pas capturée à l'origine, en utilisant des suppositions super intelligentes basées sur d'autres images similaires.

Google

Chez Google, cette technique s'appelle la synthèse d'image naturelle et, dans ce scénario particulier, la résolution d'image ultra-élevée. Vous commencez avec une petite photo pixélisée et vous vous retrouvez avec quelque chose de net, de clair et de naturel. Ce n'est peut-être pas exactement l'original, mais il est suffisamment proche pour paraître réel à l'œil humain.

Google a introduit deux nouveaux outils d'IA pour ce travail. Le premier s'appelle SR3, ou Super-Resolution via Repeated Refinement, et il fonctionne en ajoutant du bruit à une image, puis en le supprimant. Grâce à une série de calculs probabilistes basés sur une grande base de données d'images et un peu de magie d'apprentissage automatique, le SR3 peut imaginer à quoi ressemble une version super haute résolution d'une image pixel basse résolution.

Le deuxième outil est CDM, ou Cascaded Diffusion Models. Google les décrit comme des "pipelines" le long desquels les modèles de diffusion - y compris SR3 - peuvent être dirigés pour une mise à l'échelle d'image de haute qualité. Il prend des modèles d'amélioration et les transforme en images plus grandes.

Google

En utilisant différents modèles d'amélioration à différentes résolutions, l'approche CDM est capable de surpasser les méthodes alternatives de mise à l'échelle des images, selon Google. Le nouveau moteur d'IA a été testé sur ImageNet, une base de données géante d'images d'entraînement couramment utilisée pour la recherche en reconnaissance visuelle d'objets.

Les résultats finaux de SR3 et CDM sont impressionnants. Dans un test standard avec 50 volontaires humains, les images de visages humains générées par SR3 ont été confondues avec de vraies photos environ 50% du temps - et considérant qu'un algorithme idéal devrait atteindre 50%, c'est impressionnant. Il convient de répéter que ces images améliorées ne correspondent pas exactement aux originaux, ce sont des simulations soigneusement calculées basées sur les mathématiques de la probabilité.

Google

Google promet beaucoup plus de ses nouveaux moteurs d'intelligence artificielle et des technologies associées, non seulement en termes d'augmentation des images de visages et d'autres objets naturels, mais également dans d'autres domaines de la modélisation probabiliste.

Lisez aussi:

S'inscrire
Avertir de
invité

0 Commentaires
Avis intégrés
Voir tous les commentaires