Seleziona la lingua

Italian

Down Icon

Seleziona Paese

Italy

Down Icon

OpenAI lancia GPT-5: più veloce, più intelligente e più umano. Ecco cosa c’è da sapere

OpenAI lancia GPT-5: più veloce, più intelligente e più umano. Ecco cosa c’è da sapere
Tecnologia

A 32 mesi dal debutto di ChatGPT, viene alla luce GPT-5, il nuovo modello di OpenAI definito dal suo fondatore Sam Altman «un passo importante verso l’AGI (Intelligenza Artificiale Generale)», ovvero l’intelligenza artificiale generale. «Tornare a GPT-4 dopo aver provato GPT-5 sarà frustrante» ha dichiarato Altman nel corso di un briefing con i giornalisti. «La differenza è paragonabile a tornare a un vecchio telefono con schermo pixelato dopo l’iPhone. GPT-3 sembrava un liceale – ha detto – GPT-4 uno studente universitario. GPT-5 è come avere a che fare con un esperto con un PhD.»

Come è accaduto per l’ultimo modello Gpt4o anche GPT-5 verrà reso disponibile gratuitamente a tutti gli utenti di ChatGPT. Tre le versioni disponibili via API: GPT-5, GPT-5 Mini, GPT-5 Nano, per bilanciare prestazioni e costi. Esistono anche per versioni Pro e versione Plus: la differenza principale riguarda i limiti di utilizzo. Quella Pro (200 dollari) offre GPT-5 illimitato; accesso a GPT-5 Pr. Quella Plus con l’abbonamento a 21 euro al mese offre limiti di utilizzo molto più elevati rispetto alla versione Free che ricordiamo offre accesso a GPT-5 & GPT-5 mini. E’ la prima volta che gli utenti Free hanno accesso a un modello di ragionamento.

Per gli utenti Plus sarà il modello predefinito, eliminando la complessità del selettore di modelli. Inoltre, avranno anche una quantità d’uso molto maggiore di GPT-5. Quando superano il limite, passeranno a GPT-5 Mini, che è comunque molto buono.

Concettualmente, GPT-5 integra molti componenti tecnologici fra cui la linea o (i cosiddetti reasoning model, e funzionalità degli agenti intelligenti. Si candida quindi a essere una sorta di «unificatore» della proposta di OpenAI. Il team di OpenAI ha sottolineato che questo è il modello più veloce, più preciso (meno allucinazioni) e più intelligente (in matematica, scienze, programmazione), e più umano. Ma è l’aspetto della programmazione quello su cui sembrano volere puntare di più. «GPT-5 - hanno ripetuto - è il modello migliore per il coding mai creato da OpenAI». «Una delle cose più incredibili è che può creare istantaneamente un intero software da zero. Credo – ha spiegato Altman – che il concetto di “software on demand” sarà un tratto distintivo dell’era GPT-5».

Nel corso della presentazione è stato mostrato un esempio di Vibe coding, che significa poter creare qualsiasi app o software semplicemente chiedendolo al modello, senza dover saper programmare. Nello specifico, hanno creato una web app per imparare il francese. «Costruire un sito del genere richiederebbe ore di lavoro a un programmatore umano. GPT-5 lo fa in pochi secondi». In pratica, GPT-5 ha generato 600 righe di codice. Inoltre, hanno mostrato che ogni volta che si dà lo stesso prompt a GPT-5, si possono ottenere risultati diversi, tutti funzionanti.

GPT-5 è stato addestrato per riconoscere quando non può completare un compito, evitare le speculazioni e spiegare meglio i propri limiti. Questo riduce drasticamente i casi di risposte inventate ma convincenti rispetto ai modelli precedenti. I ricercatori hanno spiegato che è stato addestrato per non mentire e non simulare risposte fittizie. In caso di domande potenzialmente ambigue o pericolose, GPT-5 risponde solo con contenuti generali, per ridurre i rischi. È stata inoltre introdotta una nuova funzione: il «reasoning effort parameter», che consente di scegliere quanto il modello debba «ragionare». Si potrà insomma decidere se il modello deve ragionare profondamente, o se può restare più veloce e superficiale (utile per task semplici).

GPT-5, sostiene OpenAi precisando che non sostituisce un dottore, è il modello di OpenAI migliore mai realizzato per le domande relative alla salute. È più proattivo nel segnalare potenziali problemi e nel porre domande, e può aiutare a comprendere i risultati, a formulare le domande appropriate da sottoporre agli specialisti e a valutare le opzioni nel momento di prendere decisioni.

GPT-5 offre anche risposte più precise e affidabili e si adatta al contesto, al livello di conoscenza e alla posizione geografica dell’utente – fornendo così risposte più sicure e utili in un’ampia gamma di scenari.

Lato sicurezza, un obiettivo che si sono prefissati è quello di ottenere un modello non ingannevole. «Questo è cruciale per la sicurezza – ha spiegato Nick Turley, capo del prodotto di ChatGPT – vogliamo che il modello non menta agli utenti, sia per motivi etici sia per garantire un’esperienza utente di qualità: le persone devono potersi fidare del sistema.» Per risolvere questo, hanno addestrato GPT-5 per essere onesto. Un altro aspetto importante è evitare che gli utenti possano abusare del modello per fare del male. «In passato – ha spiegato – usavamo un sistema binario: se un prompt era considerato sicuro, il modello rispondeva. Se era pericoloso, rifiutava. Con GPT-5 usiamo un approccio chiamato “safe completions”. Il modello fornisce risposte utili, ma entro i limiti della sicurezza. Nelle domande a doppio uso, GPT-5 si limita a informazioni generali e sicure, che non possono essere usate per nuocere.» Inoltre, hanno condotto oltre 5.000 ore di test con red team esterni per assicurarsi che il sistema sia robusto contro l’abuso.

La sua uscita arriva mentre organizzazioni come BNY Mellon, California State University, Figma, Intercom, Lowe’s, Morgan Stanley, SoftBank, T-Mobile e altre hanno già fornito ai loro dipendenti l’intelligenza artificiale, con 5 milioni di utenti a pagamento che ora utilizzano i prodotti aziendali di ChatGPT, e hanno iniziato a ripensare le loro operazioni sull’API.

A marzo 2025 ha raccolto 40 miliardi di dollari a una valutazione di 300 miliardi di dollari ed è in corso una vendita secondaria di azioni che potrebbe portare la valutazione a 500 miliardi di dollari, rendendo OpenAI la start-up privata più preziosa al mondo. Oggi la creatura di Sam Altman ha oltre 120 milioni di utenti attivi giornalieri e circa 700 milioni di utenti attivi settimanali. Controlla una quota dominante, stimata tra il 59% e il 63%, del mercato degli assistenti AI. L’obiettivo è trasformare OpenAI in una colonna portante dell’infrastruttura digitale globale, con ricavi annuali ricorrenti in crescita: da circa 12 miliardi dollari oggi a una previsione di 20 miliardi USD entro fine 2025. Gpt 5 non è solo il più potente modello di Ai di OpenAi ma la dimostrazione che oggi ChatGpt è l’incotrastato leader nel settore. Ma come si misurano questo mercato?

I modelli oggi sono valutati da benchmark che misurano la loro capacità di ragionamento e le prestazioni in campi come la programmazione e la matematica. E dalle caratteristiche agentiche che hanno, cioè dalla loro capacità di orchestrare funzioni in modo autonomo. Sappiamo che non c’è modo di verificare i test che valutano l’intelligenza del modello. Come per gli altri, dobbiamo fidarci di quello che dicono i costruttori. GPT-5, scrive OpenAi, «è molto più intelligente su tutta la linea, come dimostrano le sue prestazioni nei benchmark accademici e con valutazione umana, in particolare in matematica, programmazione, percezione visiva e salute. Stabilisce un nuovo stato dell’arte in matematica (94,6% su AIME 2025 senza strumenti), nella programmazione reale (74,9% su SWE-bench Verified, 88% su Aider Polyglot), nella comprensione multimodale (84,2% su MMMU) e nel settore della salute (46,2% su HealthBench Hard) e questi miglioramenti si notano nell’uso quotidiano. Grazie al ragionamento esteso della versione Pro di GPT-5, il modello stabilisce un nuovo stato dell’arte anche su GPQA, ottenendo un punteggio dell’88,4% senza strumenti». Ricordiamo che Gemini 2.5 Deep Think ha ottenuto su benchmark come LiveCodeBench v6 (87,6%), Humanity’s Last Exam (34,8%) e la IMO 2025, dove ha raggiunto il livello medaglia di bronzo con un notevole 60,7%. In particolare nella programmazione, Opus 4.1 raggiunge il 74,5% nel benchmark SWE-bench Verified, superando la precedente generazione (Opus 4 si fermava al 72,5%).

Il problema però non sono i benchmark. Già dall’estate dell’anno scorso sono emersi i primi difetti alla legge di scala dell’Ai. All’aumentare dell’accesso ai dati non assistiamo più a un miglioramento propozionale dell’efficienza degli algoritmi. Più leggono più imparano ma non migliorano di conseguenza. Inoltre, mentre la potenza di elaborazione continua a crescere anche grazie agli ingenti investimenti delle Big tech (e alla fiducia dei mercati finanziari) i i grandi modelli linguistici faticano a trovare dataset.

Quanto manca all’AGI? Sam Altman ha spiegato che GPT-5 non è ancora AGI, ma è un grande passo avanti. Per raggiungere l’AGI sarà necessario che i modelli apprendano continuamente dal mondo reale, cosa che GPT-5 ancora non fa.

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti
ilsole24ore

ilsole24ore

Notizie simili

Tutte le notizie
Animated ArrowAnimated ArrowAnimated Arrow