Sam Altman afferma che gli scettici dello scaling hanno frenato lo sviluppo dell'IA

Il CEO di OpenAI, Sam Altman, sta puntando tutto sul potere dello scaling, sostenendo che una generazione precedente di ricercatori abbia frenato il progresso sottovalutando il potenziale dei Large Language Models (LLM). Mentre si intensifica il dibattito sul limite delle architetture transformer, Altman afferma che le prove empiriche favoriscono schiacciantemente la continua espansione della capacità di calcolo e dei dati.

Il costo del dogmatismo intellettuale

Durante una recente apparizione a Stanford, Altman ha affrontato l'attrito tra i sostenitori dello scaling e gli scettici, citando in particolare critici come Yann LeCun di Meta, che ha notoriamente descritto gli LLM come un "vicolo cieco". Altman suggerisce che gran parte della resistenza all'ipotesi dello scaling derivi dal fatto che i ricercatori sono troppo sicuri delle proprie previsioni su ciò che l'IA non può fare.

Ha sostenuto che alcune figure del settore abbiano legato la propria identità professionale a specifiche posizioni teoriche, rendendole resistenti a nuovi dati che contraddicono le loro convinzioni di lunga data. Pur riconoscendo che i "world models" siano essenziali per i progressi in campi come la robotica, Altman sostiene che l'attuale traiettoria degli LLM non sia una deviazione, ma il motore principale dell'intelligenza.

Prove empiriche: andare oltre il pattern matching

Uno dei punti più significativi nella difesa dello scaling da parte di Altman è la transizione degli LLM da semplici predittori di testo a strumenti capaci di ragionamento originale. Ha citato un recente traguardo in cui un modello di OpenAI ha smentito con successo una congettura matematica che era rimasta irrisolta dagli esperti umani per un lungo periodo.

Questo sviluppo è cruciale perché sfida la narrazione secondo cui gli LLM sarebbero semplicemente dei "pappagalli stocastici" incapaci di una vera scoperta. "Quindi, chiaramente, gli LLM sono capaci di elaborare nuova conoscenza", ha dichiarato Altman, osservando che la comunità matematica sta ora affrontando attivamente le implicazioni delle dimostrazioni guidate dall'IA. Questo cambiamento suggerisce che lo scaling non migliori solo la fluidità, ma espanda l'orizzonte delle capacità cognitive.

La frontiera: ragionamento contro compiti a lungo termine

Nonostante l'ottimismo, Altman rimane con i piedi per terra riguardo alle attuali limitazioni della tecnologia. Ha notato un netto divario di prestazioni quando si tratta di "long-horizon tasks" — flussi di lavoro complessi che richiedono un giudizio di alto livello sostenuto e una pianificazione multi-fase su periodi prolungati. In questi domini specifici, ha ammesso che gli LLM "sembrano ancora molto peggiori delle persone".

Per il panorama più ampio dell'IA, questa distinzione definisce la prossima frontiera della ricerca. Il settore si sta spostando da una fase di "scaling per la conoscenza" a una di "scaling per il ragionamento e l'agency". Mentre aziende come OpenAI e Anthropic (guidata dal CEO Dario Amodei, che condivide la convinzione di Altman sullo scaling) continuano a investire miliardi nella capacità di calcolo, l'obiettivo è colmare il divario tra l'intelligenza momentanea e un'autonomia affidabile a lungo termine.

Punti chiave

  • Lo scaling è il motore principale: Altman sostiene che sottovalutare l'impatto dell'aumento della capacità di calcolo e dei dati ha storicamente rallentato il ritmo delle scoperte nell'IA.
  • Scoperta rispetto al mimetismo: La capacità dei modelli di OpenAI di risolvere congetture matematiche complesse dimostra che gli LLM si stanno muovendo verso una genuina creazione di conoscenza.
  • Il prossimo collo di bottiglia: Sebbene lo scaling risolva molti problemi, la performance di livello umano in compiti a lungo termine e ad alto livello di giudizio rimane la prossima grande sfida del settore.