Stable Diffusion¶
Description¶
Stable Diffusion est un modèle de génération d’images open source développé par Stability AI, permettant de créer des images à partir de descriptions textuelles ou d’autres images.
Caractéristiques techniques¶
Type d’entrée/sortie : Texte vers image (text-to-image) ou image vers image (image-to-image)
Modèle : Modèle de diffusion
Statut : Open source
Date de lancement : 22 août 2022
Fonctionnement¶
Le modèle fonctionne en 5 étapes :
Description par l’utilisateur
Compression de l’image par l’auto-encodeur variationnel (VAE)
Ajout de bruit gaussien
Débruitage par le bloc U-Net
Génération de l’image finale par le décodeur VAE
Tarification¶
Gratuit : Complètement gratuit (code open source)
Installation locale : Possible sur machine personnelle
Avantages¶
Extrêmement rapide
Photoréalisme élevé
Flexibilité dans les styles
Open source et modifiable
Installation locale possible
Inconvénients¶
Aucune limitation d’utilisation (risque de deepfakes)
Coûts de calcul élevés
Courbe d’apprentissage importante
Nécessite une bonne configuration matérielle