Knowledge Cutoff: cos'è e significato nell'IA

Il knowledge cutoff è la data oltre la quale un LLM non ha visto dati durante l'addestramento. È un limite hard: il modello "non sa" quello che è successo dopo, a meno che tu non glielo dica esplicitamente o non abbia accesso a tool di ricerca.

Esempi:

GPT-4 originale: cutoff settembre 2021.
Claude 3.5 Sonnet: cutoff aprile 2024.
GPT-4o: cutoff ottobre 2023.
Modelli del 2026: cutoff tipicamente metà 2025 o dopo.

Implicazioni pratiche:

Il modello non sa di eventi recenti, news, prodotti lanciati di recente.
Se chiedi "che modello GPT è uscito di recente", potrebbe dirti uno vecchio.
Per cose tempo-critiche, serve integrare ricerca live.

Soluzioni:

Tool use: il modello può chiamare un motore di ricerca per info aggiornate.
RAG: gli passi documenti aggiornati nel context.
Fornire context manualmente: tu nel prompt gli dici la data attuale e fatti rilevanti.

Modelli con accesso al web (Perplexity, ChatGPT con browse, Gemini con search): bypassano il cutoff usando tool, ma non sostituiscono completamente — hanno comunque conoscenza "core" pre-cutoff.

Trick: chiedere al modello "qual è il tuo knowledge cutoff?" è un buon modo per capire quanto fidarti delle sue affermazioni su cose recenti.

Knowledge Cutoff

Vedi anche

Articoli che parlano di Knowledge Cutoff