Stable Diffusion è il primo grande modello generativo di immagini rilasciato come open source al pubblico. Lanciato nel 2022 da Stability AI, ha democratizzato la generazione di immagini IA.
Caratteristiche:
- Pesi liberi e scaricabili.
- Gira su GPU consumer (anche Mac M-series).
- Versioni: 1.5, 2, XL, 3, 3.5, e successori.
- Comunità open: migliaia di varianti, fine-tuning per stili specifici, modelli specializzati.
Tool di front-end per usarlo:
- Automatic1111: classico, web UI completa.
- ComfyUI: node-based, per workflow complessi.
- Forge, SD.Next: forks performanti.
- Krita AI plugin: integrato nell'editor open source.
Vantaggi:
- Privacy: tutto sul tuo PC, niente upload.
- Costo zero: dopo aver comprato la GPU.
- Customizzabile: fine-tuning, LoRA, modelli specifici per ogni stile.
- Comunità: Civit.ai ha migliaia di modelli derivati gratuiti.
Svantaggi:
- Setup tecnico iniziale (driver GPU, Python, dipendenze).
- Qualità out-of-the-box leggermente sotto Midjourney/FLUX premium.
- Servono pochi minuti per generare immagini di alta qualità (vs istantaneo nei servizi cloud).
Nel 2024-2025 è arrivato FLUX, sviluppato da ex-Stable Diffusion, che ha alzato l'asticella della generazione open source. Ma Stable Diffusion resta la base di un ecosistema enorme.