RAG sta per Retrieval Augmented Generation. È una delle tecniche più importanti dell'IA professionale. Funziona così:
- Hai una marea di documenti tuoi (manuali, contratti, articoli, base di conoscenza).
- Li trasformi in embedding (rappresentazioni numeriche del significato) e li metti in un vector database.
- Quando arriva una domanda, il sistema cerca i 5-10 documenti più rilevanti.
- Li passa al modello LLM insieme alla domanda dell'utente.
- Il modello risponde basandosi su quei documenti, non sulla sua memoria pre-addestrata.
Perché è importante:
- Riduce le allucinazioni: il modello non inventa, cita roba reale che gli hai dato tu.
- Usa info aggiornate: gli LLM hanno cutoff (data di addestramento). Con RAG accedi a documenti freschi.
- Mantiene i tuoi dati privati: non addestri il modello, gli passi solo i documenti rilevanti caso per caso.
- Tracciabile: sai esattamente da quale documento è arrivata la risposta.
RAG è la tecnica che sta dietro a chatbot aziendali seri, ai motori di ricerca con IA (Perplexity), e a praticamente tutte le applicazioni IA professionali in azienda. Capire RAG è il primo passo per uscire dal "ChatGPT consumer" e fare cose vere.