Zero-shot: cos'è e significato nell'IA

Zero-shot significa chiedere a un modello IA di fare un task senza fornirgli esempi specifici di come va fatto. Si basa sul fatto che il modello, durante il pretraining, ha visto miliardi di esempi e "sa già" generalmente come si fanno le cose.

Esempio zero-shot: "Traduci 'Buongiorno, come stai?' in francese." → il modello traduce, senza che tu gli abbia dato esempi di traduzioni.

Esempio few-shot (con esempi): "Traduci queste frasi: 'ciao' → 'salut', 'bonjour' → 'buongiorno'. Ora traduci 'come stai'." → il modello deduce dalla pattern.

Esempio one-shot: tipo few-shot ma con un solo esempio.

Quando funziona zero-shot:

Task ben rappresentato nel pretraining (traduzione, riassunto, scrittura standard).
Modelli sufficientemente capaci (GPT-4, Claude, Gemini sono molto bravi in zero-shot).
Istruzioni chiare nel prompt.

Quando NON funziona zero-shot:

Task molto specifico al tuo dominio (medicina specialistica, legge italiana di nicchia).
Output con format esatto custom.
Tono o stile specifico.
Modelli più piccoli o meno capaci.

Quando è meglio few-shot: dare 2-3 esempi cambia spesso la qualità da decente a ottima. Per task ripetitivi, few-shot è la scelta professionale.

Trend: i modelli moderni sono sempre più bravi in zero-shot, riducendo la necessità di few-shot. Ma per produzione, dare esempi resta una best practice.

Vedi anche