Zero-shot significa chiedere a un modello IA di fare un task senza fornirgli esempi specifici di come va fatto. Si basa sul fatto che il modello, durante il pretraining, ha visto miliardi di esempi e "sa già" generalmente come si fanno le cose.
Esempio zero-shot: "Traduci 'Buongiorno, come stai?' in francese." → il modello traduce, senza che tu gli abbia dato esempi di traduzioni.
Esempio few-shot (con esempi): "Traduci queste frasi: 'ciao' → 'salut', 'bonjour' → 'buongiorno'. Ora traduci 'come stai'." → il modello deduce dalla pattern.
Esempio one-shot: tipo few-shot ma con un solo esempio.
Quando funziona zero-shot:
- Task ben rappresentato nel pretraining (traduzione, riassunto, scrittura standard).
- Modelli sufficientemente capaci (GPT-4, Claude, Gemini sono molto bravi in zero-shot).
- Istruzioni chiare nel prompt.
Quando NON funziona zero-shot:
- Task molto specifico al tuo dominio (medicina specialistica, legge italiana di nicchia).
- Output con format esatto custom.
- Tono o stile specifico.
- Modelli più piccoli o meno capaci.
Quando è meglio few-shot: dare 2-3 esempi cambia spesso la qualità da decente a ottima. Per task ripetitivi, few-shot è la scelta professionale.
Trend: i modelli moderni sono sempre più bravi in zero-shot, riducendo la necessità di few-shot. Ma per produzione, dare esempi resta una best practice.