DeepSeek è un laboratorio di ricerca cinese di IA, parte di un fondo finanziario cinese. Sede a Hangzhou. È diventato famoso a livello globale a inizio 2025 quando il rilascio dei loro modelli ha fatto crollare le valutazioni di Nvidia di 600 miliardi di dollari in un giorno.
Linee di modelli:
- DeepSeek-V series: modelli generalisti.
- DeepSeek-R series: modelli per ragionamento (CoT esteso).
- DeepSeek-Coder: per programmazione.
- DeepSeek-Math: per matematica.
Caratteristiche distintive:
- Open weights: pubblicano i pesi sotto licenze permissive.
- Costi bassi: API a frazione del prezzo dei competitor americani.
- Efficienza: ottengono performance top con meno calcolo grazie a innovazioni architetturali (MoE aggressive, attention efficiency).
- Trasparenza tecnica: i loro paper sono tra i più chiari del settore.
Pro per chi sviluppa:
- Costi imbattibili.
- Performance comparabili o superiori a Sonnet/GPT su molti benchmark.
- Modelli scaricabili per self-hosting.
Contro:
- Servizi cloud su server cinesi (giurisdizione cinese, rischi privacy/governance).
- Bias politici: censure su argomenti sensibili al governo cinese.
- Per dati di clienti europei serve self-hosting o cautela.
Per uso aziendale serio: scaricare i pesi e farli girare in proprio sui propri server in Italia/EU. Performance top, niente preoccupazioni di geopolitica.