Llama 3 rilasciato da Meta ad aprile 2024 (8B e 70B), poi luglio 2024 esce la versione 405B (dentro la famiglia "Llama 3.1"). Settembre 2024 arriva Llama 3.2 multimodale.
Importanza storica: la 405B è il primo modello open weights davvero competitivo con i flagship proprietari (GPT-4, Claude Opus). Cambia il gioco: chi ha l'hardware adatto può usare un modello frontier senza pagare l'API a OpenAI.
Caratteristiche:
- 8B: gira su laptop decente, ottima per uso locale.
- 70B: server con 2 GPU buone, qualità altissima per task generali.
- 405B: serve infrastruttura seria (decine di GPU H100), ma compete con i top.
- 3.2 multimodale: 11B e 90B con visione.
Licenza: Meta la chiama "open" ma ha clausole. Le aziende sopra i 700 milioni di utenti attivi mensili devono chiedere licenza separata. Per il resto del mondo, uso commerciale libero.
Dove gira: Ollama, LM Studio, Hugging Face, tutti i provider cloud. Disponibile dentro WhatsApp, Instagram come "Meta AI".
Verdetto onesto: nel 2024 Llama 3 è stato il padrone dell'open weights. Nel 2025 viene scavalcato in alcune aree da DeepSeek e Qwen, ma resta una scelta solida. Per uso locale a 70B, ancora oggi è tra le migliori opzioni.