DBRX rilasciato da Databricks a marzo 2024. Modello Mixture-of-Experts: 132 miliardi di parametri totali, 36 miliardi attivi per token (16 esperti, 4 attivi).
Chi è Databricks: piattaforma dati enterprise (lakehouse) usata da migliaia di aziende per analytics e ML. Lanciare un proprio LLM è il loro modo di entrare nel gioco IA generativa.
Caratteristiche:
- Open weights su Hugging Face (licenza Databricks Open Model License, simile a Llama).
- Context window 32k.
- Performance al lancio: tra GPT-3.5 e GPT-4 sui benchmark generali, molto bravo su SQL e codice.
- Servito direttamente dentro Databricks Mosaic AI.
Posizionamento: Databricks lo vende soprattutto ai propri clienti enterprise, integrato con i loro sistemi di dati. Per chi è già su Databricks, usare DBRX (o farci fine-tuning) è naturale.
Pro: integrazione nativa con dati aziendali su Lakehouse, performance solide, licenza ragionevole.
Contro onesti: poco usato fuori dall'ecosistema Databricks. Nel mondo open generale, Llama, DeepSeek, Qwen hanno preso il sopravvento. DBRX resta una nicchia per i clienti enterprise di Databricks.
Verdetto: utile sapere che esiste, raramente la scelta giusta se non sei già cliente Databricks.