DeepSeek

[diip-siik]

Laboratorio cinese di IA. Pubblica modelli open weights di altissima qualità a costi molto bassi. Ha terremotato la Silicon Valley nel 2025.

DeepSeek è un laboratorio di ricerca cinese di IA, parte di un fondo finanziario cinese. Sede a Hangzhou. È diventato famoso a livello globale a inizio 2025 quando il rilascio dei loro modelli ha fatto crollare le valutazioni di Nvidia di 600 miliardi di dollari in un giorno.

Linee di modelli:

  • DeepSeek-V series: modelli generalisti.
  • DeepSeek-R series: modelli per ragionamento (CoT esteso).
  • DeepSeek-Coder: per programmazione.
  • DeepSeek-Math: per matematica.

Caratteristiche distintive:

  • Open weights: pubblicano i pesi sotto licenze permissive.
  • Costi bassi: API a frazione del prezzo dei competitor americani.
  • Efficienza: ottengono performance top con meno calcolo grazie a innovazioni architetturali (MoE aggressive, attention efficiency).
  • Trasparenza tecnica: i loro paper sono tra i più chiari del settore.

Pro per chi sviluppa:

  • Costi imbattibili.
  • Performance comparabili o superiori a Sonnet/GPT su molti benchmark.
  • Modelli scaricabili per self-hosting.

Contro:

  • Servizi cloud su server cinesi (giurisdizione cinese, rischi privacy/governance).
  • Bias politici: censure su argomenti sensibili al governo cinese.
  • Per dati di clienti europei serve self-hosting o cautela.

Per uso aziendale serio: scaricare i pesi e farli girare in proprio sui propri server in Italia/EU. Performance top, niente preoccupazioni di geopolitica.