Il supervised learning è il tipo di machine learning più diretto: dai al modello esempi del tipo "input → output corretto" e lui impara la regola che li lega.
Esempi classici:
- Foto di gatti etichettate "gatto", foto di cani etichettate "cane". Modello impara a classificare.
- Email etichettate "spam" o "non spam". Modello impara filtro spam.
- Testi tradotti italiano→inglese. Modello impara traduzione.
- Casi di malattia con diagnosi. Modello impara a fare prima diagnosi.
Vantaggi:
- Approccio diretto e potente quando hai dati etichettati.
- Risultati misurabili (accuracy, precision, recall).
- Controllo sul tipo di output desiderato.
Svantaggi:
- Servono dati etichettati. Etichettare dati costa tanto e richiede tempo.
- Le etichette possono essere sbagliate o biased, e il modello erediterà gli errori.
- Per task complessi (cosa è una "buona risposta"?) le etichette sono soggettive.
Differenza con altri tipi:
- Unsupervised: senza etichette. Il modello scopre pattern da solo.
- Self-supervised: il modello genera le proprie etichette dai dati (es. predire la prossima parola).
- Reinforcement: il modello impara da feedback (premio/punizione) invece di etichette.