Decoder

[decòder]

Parte di un modello che genera output sequenza per sequenza, una unità (token) alla volta. Cuore degli LLM generativi tipo GPT.

Il decoder è la parte di un modello neurale che genera output un pezzo alla volta. In un LLM generativo, il decoder produce il testo token dopo token, ognuno basandosi su quelli generati prima.

I modelli decoder-only sono quelli che dominano l'IA generativa moderna: GPT, Claude, Gemini, Llama, Mistral. Tutti decoder-only.

Funzionamento base:

  1. Riceve un input (il prompt).
  2. Genera il primo token di output.
  3. Aggiunge quel token al contesto, genera il secondo.
  4. Continua finché non arriva al token "fine sequenza" o al limite di lunghezza.

È un processo autoregressivo: ogni nuova parola dipende da tutte le precedenti.

Vantaggi del decoder-only:

  • Architettura semplice.
  • Si scala bene con dimensioni enormi.
  • Generazione fluida.

Limiti:

  • Generazione sequenziale = lenta. Non si può parallelizzare la generazione di token diversi.
  • Difficile cambiare token già generati senza ricominciare.
  • Bias accumulati: se il primo token è sbagliato, può portare a derivare tutta la risposta.