Stable Diffusion

[stèibol difùsciòn]

Modello open source per generazione immagini. Lo scarichi e lo fai girare sul tuo PC. Base di tantissimi tool e workflow creativi.

Stable Diffusion è il primo grande modello generativo di immagini rilasciato come open source al pubblico. Lanciato nel 2022 da Stability AI, ha democratizzato la generazione di immagini IA.

Caratteristiche:

  • Pesi liberi e scaricabili.
  • Gira su GPU consumer (anche Mac M-series).
  • Versioni: 1.5, 2, XL, 3, 3.5, e successori.
  • Comunità open: migliaia di varianti, fine-tuning per stili specifici, modelli specializzati.

Tool di front-end per usarlo:

  • Automatic1111: classico, web UI completa.
  • ComfyUI: node-based, per workflow complessi.
  • Forge, SD.Next: forks performanti.
  • Krita AI plugin: integrato nell'editor open source.

Vantaggi:

  • Privacy: tutto sul tuo PC, niente upload.
  • Costo zero: dopo aver comprato la GPU.
  • Customizzabile: fine-tuning, LoRA, modelli specifici per ogni stile.
  • Comunità: Civit.ai ha migliaia di modelli derivati gratuiti.

Svantaggi:

  • Setup tecnico iniziale (driver GPU, Python, dipendenze).
  • Qualità out-of-the-box leggermente sotto Midjourney/FLUX premium.
  • Servono pochi minuti per generare immagini di alta qualità (vs istantaneo nei servizi cloud).

Nel 2024-2025 è arrivato FLUX, sviluppato da ex-Stable Diffusion, che ha alzato l'asticella della generazione open source. Ma Stable Diffusion resta la base di un ecosistema enorme.