Zero-shot

[zìro-shot]

Quando chiedi a un'IA di fare un task senza dargli esempi. Funziona perché i grandi LLM sono addestrati su tantissimo che 'sanno già fare cose'.

Zero-shot significa chiedere a un modello IA di fare un task senza fornirgli esempi specifici di come va fatto. Si basa sul fatto che il modello, durante il pretraining, ha visto miliardi di esempi e "sa già" generalmente come si fanno le cose.

Esempio zero-shot: "Traduci 'Buongiorno, come stai?' in francese." → il modello traduce, senza che tu gli abbia dato esempi di traduzioni.

Esempio few-shot (con esempi): "Traduci queste frasi: 'ciao' → 'salut', 'bonjour' → 'buongiorno'. Ora traduci 'come stai'." → il modello deduce dalla pattern.

Esempio one-shot: tipo few-shot ma con un solo esempio.

Quando funziona zero-shot:

  • Task ben rappresentato nel pretraining (traduzione, riassunto, scrittura standard).
  • Modelli sufficientemente capaci (GPT-4, Claude, Gemini sono molto bravi in zero-shot).
  • Istruzioni chiare nel prompt.

Quando NON funziona zero-shot:

  • Task molto specifico al tuo dominio (medicina specialistica, legge italiana di nicchia).
  • Output con format esatto custom.
  • Tono o stile specifico.
  • Modelli più piccoli o meno capaci.

Quando è meglio few-shot: dare 2-3 esempi cambia spesso la qualità da decente a ottima. Per task ripetitivi, few-shot è la scelta professionale.

Trend: i modelli moderni sono sempre più bravi in zero-shot, riducendo la necessità di few-shot. Ma per produzione, dare esempi resta una best practice.