RAG(Retrieval Augmented Generation)

[rag]

Tecnica che fa rispondere l'IA basandosi su documenti che gli dai tu, non sulla sua memoria interna. Riduce drasticamente le allucinazioni.

RAG sta per Retrieval Augmented Generation. È una delle tecniche più importanti dell'IA professionale. Funziona così:

  1. Hai una marea di documenti tuoi (manuali, contratti, articoli, base di conoscenza).
  2. Li trasformi in embedding (rappresentazioni numeriche del significato) e li metti in un vector database.
  3. Quando arriva una domanda, il sistema cerca i 5-10 documenti più rilevanti.
  4. Li passa al modello LLM insieme alla domanda dell'utente.
  5. Il modello risponde basandosi su quei documenti, non sulla sua memoria pre-addestrata.

Perché è importante:

  • Riduce le allucinazioni: il modello non inventa, cita roba reale che gli hai dato tu.
  • Usa info aggiornate: gli LLM hanno cutoff (data di addestramento). Con RAG accedi a documenti freschi.
  • Mantiene i tuoi dati privati: non addestri il modello, gli passi solo i documenti rilevanti caso per caso.
  • Tracciabile: sai esattamente da quale documento è arrivata la risposta.

RAG è la tecnica che sta dietro a chatbot aziendali seri, ai motori di ricerca con IA (Perplexity), e a praticamente tutte le applicazioni IA professionali in azienda. Capire RAG è il primo passo per uscire dal "ChatGPT consumer" e fare cose vere.