Come riassumere un PDF di 200 pagine in 2 minut...

Hai sul desktop un PDF da duecento pagine. Una sentenza, un bilancio, un contratto, un libro tecnico. Ti ci vogliono ore a leggerlo. Tu lo sai, e siccome non hai voglia, finisce che leggi le prime venti pagine e l'ultima. Brutto, ma tutti lo fanno.

L'IA in due minuti te lo mastica e ti tira fuori i punti chiave. Non è magia: è una cosa che funziona davvero, da almeno tre anni. Solo che la maggior parte della gente che ci prova la fa nel modo sbagliato. Caricano il file su ChatGPT pubblico e si fanno fregare. Vediamo come si fa giusto.

Il problema vero non è riassumere

Il problema è cosa stai dando in pasto, e a chi. Se quel PDF contiene il bilancio di un cliente, l'anamnesi di un paziente, una bozza di contratto riservato o un atto di causa, caricarlo su ChatGPT pubblico è esattamente quello che il GDPR vieta. Ma anche se il documento è pubblico, c'è un altro problema: ChatGPT, di default, non legge il PDF intero. Lo divide in pezzi e tu non lo sai.

Risultato: chiedi un riassunto, ti arriva una cosa che sembra buona, ma manca metà delle informazioni. Tu firmi convinto. Sbagli.

Le tre regole prima di iniziare

Capisci cosa c'è dentro. Se sono dati personali (tuoi clienti, dipendenti, pazienti), vai direttamente al paragrafo "i dati delicati" più in basso. Non passare dal via.
Conta le pagine. Sotto le 30, qualunque IA seria mangia tutto in un colpo. Sopra le 100, devi fare lavoro fatto bene, altrimenti perdi pezzi.
Decidi cosa cerchi. "Riassumimi" è un comando da pigro. "Riassumi sezione A, dimmi i tre punti più rischiosi, segnalami clausole capestro" è da professionista. La differenza nei risultati è enorme.

Il flusso che funziona davvero

Ti spiego il modo che uso io quando devo macinare documenti seri. Niente magia, ma seguilo passo passo.

Passo 1 — Scegli il modello giusto

Per documenti lunghi serve un modello con contesto lungo. Quanto ne mangia in un colpo solo. I tre che funzionano oggi:

Claude di Anthropic: contesto enorme, gestisce 500 pagine senza piangere. Nella mia esperienza è quello che capisce meglio i documenti legali e finanziari italiani.
Gemini di Google: contesto altissimo, gratis nella versione base. Buono ma a volte sintetizza troppo.
ChatGPT: con i piani a pagamento gestisce documenti grossi. Versione free taglia presto.

Per documenti riservati nessuno dei tre va bene così com'è. Vedi paragrafo "dati delicati".

Passo 2 — Carica il file, non incollare il testo

Tutti e tre accettano upload diretto del PDF. Caricalo come file, non come testo incollato. Differenza enorme: il file mantiene la struttura (titoli, tabelle, indici), il testo incollato è una pappa.

Passo 3 — Il prompt che cambia tutto

Niente "riassumimi questo documento". È un prompt da principiante. Usa questo:

"Prima dimmi: che tipo di documento è e quante sezioni principali ha? Poi, per ogni sezione, dammi un riassunto di 5 righe che includa: titolo della sezione, decisione/argomento principale, eventuali rischi o punti critici, eventuali date o numeri rilevanti. Alla fine fammi un riassunto generale di mezza pagina e segnalami le tre cose più importanti che dovrei rivedere personalmente."

Vedrai che cambia mondo. Stai dicendo all'IA come riassumere, non solo cosa.

Passo 4 — Verifica a campione

Mai fidarsi al cento per cento. L'IA può inventarsi cose (allucinazioni). Prendi due o tre dati specifici dal riassunto (una data, un importo, un nome) e cercali nel PDF originale con Ctrl+F. Se ci sono e corrispondono, il riassunto è probabilmente buono. Se non li trovi, il riassunto va riletto con sospetto.

I dati delicati: lì le cose cambiano

Tutto quello che hai letto sopra vale per documenti pubblici, generici, tuoi materiali, articoli. Per documenti che contengono dati personali di altre persone (clienti, pazienti, dipendenti, controparti) le regole sono diverse.

ChatGPT, Gemini, Claude in versione consumer trasferiscono i tuoi documenti su server americani. Per dati personali questo richiede informativa GDPR specifica, base giuridica, e nelle versioni gratuite spesso non hai garanzie sul fatto che il documento non finisca nei dati di addestramento. Per chi è soggetto a segreto professionale (avvocati, medici, commercialisti, psicologi) può essere una violazione disciplinare.

Per quei casi servono soluzioni dove il documento resta dentro il tuo sistema. Esistono e non sono nemmeno costose, ma vanno scelte sapendo cosa si fa. Te ne parlerò nel dizionario sotto la voce "RAG privato" e nelle guide dedicate per professione.

Errori che vedo fare ovunque

Caricare il PDF su versione gratuita di un servizio cloud e poi "intervistare" l'IA chiedendole cose specifiche. La versione gratuita ha limiti di contesto bassi e ti restituisce risposte plausibili ma incomplete. Tu credi di sapere, e invece sai a metà.
Fare un solo prompt enorme con dieci richieste diverse. Funziona meglio una conversazione: prima panoramica, poi domande specifiche.
Non specificare la lingua dell'output. Se il PDF è in inglese tecnico e tu vuoi il riassunto in italiano, dillo all'inizio. Risparmi tempo.
Usare un PDF scansionato (immagine) senza OCR. Il modello non vede testo, vede pixel. Risultato: spazzatura. Se il PDF è scansionato, prima passalo da un OCR (anche Adobe gratis va bene), poi caricalo.

Quanto tempo risparmi davvero

Per un documento di 200 pagine, lettura attenta richiede dalle 4 alle 8 ore. Con il flusso che ti ho descritto, in 15-30 minuti hai un riassunto strutturato + verifica dei punti chiave. Da lì decidi se ti basta o se devi rileggerti due o tre sezioni nel dettaglio. Nel mio caso, su dieci documenti che leggo a settimana, l'IA mi fa risparmiare l'equivalente di una giornata di lavoro pieno.

Non è che leggi meno. Leggi meglio. Concentri il tempo sulle parti che contano.

Come riassumere un PDF di 200 pagine in 2 minuti (e perché di solito lo fai sbagliato)