Un documento OpenAI rivela la nuova gamma di modelli GPT-5.6 Pro a livelli
Un recente documento di benchmark genomico rilasciato da OpenAI ha involontariamente svelato il futuro di ChatGPT Pro. Invece di un singolo modello di punta, i dati suggeriscono che OpenAI stia preparando una sofisticata gamma "Pro" a tre livelli, progettata per bilanciare potenza di ragionamento, throughput e costi.
I tre pilastri: Sol, Terra e Luna Pro
Per gran parte della sua storia, l'offerta "Pro" di OpenAI ha funzionato come un unico livello monolitico: il miglior modello assoluto disponibile per gli utenti esperti. Tuttavia, il documento genomico trapelato introduce tre distinte varianti "Pro (Extended)" che rispecchiano l'attuale architettura GPT-5.6: Sol Pro, Terra Pro e Luna Pro.
In base ai benchmark, questi modelli sono categorizzati in base alla loro utilità prevista:
- Sol Pro: Il colosso del ragionamento avanzato, progettato per i compiti analitici più complessi e multi-fase.
- Terra Pro: Una variante ad alto volume, ottimizzata per carichi di lavoro aziendali massicci e throughput su scala enterprise.
- Luna Pro: Una variante leggera, veloce ed economica, pensata per query quotidiane ad alta frequenza.
Benchmark del salto di prestazioni
Il benchmark genomico fornisce prove concrete del delta di prestazioni tra i modelli standard e le loro controparti Pro. Lo studio ha misurato un "pass rate" — ovvero la capacità di completare un'analisi multi-fase senza errori — attraverso una suite di 129 task.
I risultati indicano che le varianti Pro offrono incrementi di intelligenza significativi, in particolare per i livelli inferiori. Sol Pro è emerso come il leader indiscusso, raggiungendo un pass rate del 31,5%. Questo supera il modello Sol standard (28,7%) ed eclissa significativamente i pesi massimi attuali del settore, come Claude Opus 4.8, che ha ottenuto un punteggio del 16,0%.
Interessante notare che il "boost Pro" non è uniforme. I dati mostrano che l'aggiunta di potenza di calcolo offre rendimenti decrescenti all'aumentare della complessità del modello. Mentre Luna Pro ha registrato un enorme salto di 7 punti rispetto alla versione standard, Sol Pro ha visto un incremento più modesto, inferiore ai 3 punti. Significativamente, Terra Pro ha raggiunto un pass rate del 28,5%, il che significa che il modello Pro ad alto volume di OpenAI si comporta quasi quanto il modello Sol standard di punta.
Un cambiamento strategico nell'implementazione dell'IA
Questa rivelazione segna un cambiamento fondamentale nella strategia di prodotto di OpenAI. Allontanandosi da un livello Pro "universale", OpenAI affronta il principale punto di attrito per sviluppatori e imprese: il compromesso tra intelligenza ed efficienza.
Fornire un "Terra Pro" che eguagli l'intelligenza del modello di punta ma sia ottimizzato per il volume consente alle aziende di scalare gli agenti IA senza i costi proibitivi di un modello di puro ragionamento. Allo stesso modo, un "Luna Pro" offre una via di mezzo per gli utenti che necessitano di maggiore affidabilità rispetto a un modello standard, ma non possono giustificare la latenza di un'esecuzione completa su Sol.
Sebbene OpenAI non abbia commentato ufficialmente questi nomi o i costi specifici dei token — che erano notevolmente assenti dal calcolo computazionale del documento — la roadmap tecnica è chiara. L'era dell'unico modello di punta sta finendo, sostituita da un ecosistema specializzato di modelli di livello professionale.
Punti chiave
- Architettura Pro a livelli: OpenAI si sta probabilmente muovendo verso una gamma Pro a tre modelli (Sol, Terra e Luna) piuttosto che un'unica sottoscrizione di fascia alta.
- Ragionamento superiore: Sol Pro ha stabilito un nuovo standard nella genomica con un pass rate del 31,5%, superando significativamente i concorrenti come Claude Opus 4.8.
- Guadagni di efficienza: La nuova struttura consente agli utenti di scegliere tra la massima potenza di ragionamento, un alto throughput o una velocità economica.
