NLP(Natural Language Processing)

[enne-elle-pi]

Branca dell'IA che si occupa del linguaggio naturale: capire, generare, tradurre, classificare testo. Cuore degli LLM.

Il Natural Language Processing (NLP) è la branca dell'informatica e dell'IA che si occupa di far capire ai computer il linguaggio umano (italiano, inglese, ecc.) e di farglielo generare.

Sotto-aree NLP classiche:

  • Tokenization: spezzare testo in parole/token.
  • POS tagging: identificare ruolo grammaticale (verbo, sostantivo).
  • Named Entity Recognition: identificare nomi propri (persone, luoghi, aziende).
  • Sentiment analysis: capire se un testo è positivo o negativo.
  • Question answering: rispondere a domande dato un testo.
  • Translation: tradurre da una lingua all'altra.
  • Summarization: riassumere testi lunghi.
  • Text classification: assegnare categorie.
  • Coreference resolution: capire a chi/cosa si riferisce un pronome.

Storia rapida:

  • Anni 50-90: regole hard-coded, parser sintattici. Limitati.
  • Anni 2000: machine learning statistico. Buoni progressi.
  • 2013: Word2Vec, embedding di parole.
  • 2018: BERT, transformer pre-trainati.
  • 2020+: GPT-3 e successori, LLM generativi.
  • Oggi: gli LLM hanno assorbito praticamente tutta la NLP "classica".

Stato attuale: per la maggior parte dei task NLP nel 2026, "lancia un LLM" è la soluzione. Sentiment? GPT lo fa. Traduzione? Claude lo fa. Question answering? RAG + LLM.

I task NLP "specializzati" (NER, POS tagging) sopravvivono in pipeline industriali dove servono velocità e costi bassissimi (modelli classici come spaCy sono molto più veloci di un LLM per questi task).

Per chi sviluppa: la NLP non è morta, è "salita di livello". Adesso si combina LLM + tecniche classiche per pipeline robuste e economiche.