Qwen è la famiglia di modelli IA di Alibaba Cloud. "Qwen" = "Tongyi Qianwen" abbreviato. Cinese, di Alibaba, una delle big tech cinesi.
Versioni:
- Qwen 1, 1.5, 2, 2.5, 3 (e successori): evoluzione progressiva.
- Dimensioni: da modelli piccolissimi (0.5B) a giganti (Qwen Max, decine di miliardi).
- Versioni specializzate: Qwen-Coder, Qwen-Math, Qwen-VL (vision).
Caratteristiche:
- Open weights: pesi pubblicati con licenze permissive.
- Multilingua serio: oltre il cinese, gestisce molto bene inglese, e decentemente lingue europee.
- Performance: costantemente tra i top dei modelli aperti nei benchmark.
- Efficienza: ottimizzati per inference relativamente veloce.
Quando ha senso usarlo:
- Self-hosting per chi vuole alternative non-americane.
- Task in lingua cinese o asiatica.
- Workload generici dove servono performance top a costo basso.
Considerazioni geopolitiche: come per DeepSeek, l'API ufficiale è su server cinesi. Per modello self-hosted i pesi sono "neutrali" ma hanno bias culturali e censure su argomenti sensibili al governo cinese.
Per molti casi d'uso aziendali europei, Qwen è una valida alternativa a Llama o Mistral, soprattutto se hai bisogno di multilingua serio.