Llama 3

[làma tre]

Generazione 2024 dei modelli open weights di Meta. Tre taglie: 8B, 70B, 405B. La 405B è il primo open che compete davvero con GPT-4.

Llama 3 rilasciato da Meta ad aprile 2024 (8B e 70B), poi luglio 2024 esce la versione 405B (dentro la famiglia "Llama 3.1"). Settembre 2024 arriva Llama 3.2 multimodale.

Importanza storica: la 405B è il primo modello open weights davvero competitivo con i flagship proprietari (GPT-4, Claude Opus). Cambia il gioco: chi ha l'hardware adatto può usare un modello frontier senza pagare l'API a OpenAI.

Caratteristiche:

  • 8B: gira su laptop decente, ottima per uso locale.
  • 70B: server con 2 GPU buone, qualità altissima per task generali.
  • 405B: serve infrastruttura seria (decine di GPU H100), ma compete con i top.
  • 3.2 multimodale: 11B e 90B con visione.

Licenza: Meta la chiama "open" ma ha clausole. Le aziende sopra i 700 milioni di utenti attivi mensili devono chiedere licenza separata. Per il resto del mondo, uso commerciale libero.

Dove gira: Ollama, LM Studio, Hugging Face, tutti i provider cloud. Disponibile dentro WhatsApp, Instagram come "Meta AI".

Verdetto onesto: nel 2024 Llama 3 è stato il padrone dell'open weights. Nel 2025 viene scavalcato in alcune aree da DeepSeek e Qwen, ma resta una scelta solida. Per uso locale a 70B, ancora oggi è tra le migliori opzioni.