Il Bernoccolo #192 🎤 AI: i nuovi modelli che riaprono i giochi
Dopo un’iniziale corsa a rilasciare modelli più rapidamente possibile, nel mondo dell’intelligenza artificiale il ritmo sembra essere un po’ cambiato. È vero, nella vostra inbox arrivano ancora cinquanta nuovi prodotti AI al giorno, ma i giganti si muovono un po’ diversamente. Ora che l’attenzione dei media è alta, non si tratta più solo di avere una notizia da dare, né di dire “ci sono anche io!” ma di arrivare al mercato con un prodotto effettivamente migliore e più solido.
Non più esperimenti, ma strumenti che reggano lo scrutinio implacabile del mercato. Non più provocazioni, ma colpi da K.O. La notizia più fresca in questo senso arriva da OpenAI e per una volta non riguarda strettamente GPT. O meglio, riguarda anche GPT, ma questa volta si parla di immagini. E si torna a parlare di DALLE. Il modello text-to-image dell’azienda di Sam Altman, lanciato in beta a luglio dell’anno scorso, sembrava essere stato abbandonato, largamente superato nei risultati da Midjourney e persino da Stable Diffusion.
Ora Open AI torna alla carica con DALLE 3, un modello molto più capace, che punta a riprendersi quote di mercato sfruttando i punti deboli degli avversari. Innanzitutto, la capacità di capire prompt in linguaggio naturale, grazie all’integrazione con GPT. Poi, la possibilità di creare testi sensati. Infine, delle API per usare il modello anche al di fuori della sua piattaforma.
Ma per un colpo dato, ce n’è uno preso. In questo caso è Google a sferrarlo, annunciando l’arrivo di Gemini: non un language model ma una collezione di language model in grado di svolgere molti compiti diversi. Un prodotto che potrebbe mettere in seria difficoltà GPT, anche perché - se la bontà di un modello discende dalla qualità e quantità dei dati usati per addestrarlo - allora Google ha un bel vantaggio.
E non è tutto: Google annuncia anche le estensioni di Bard: il servizio di chat AI sarà presto integrato in tutti i prodotti Google come ad esempio Google Slides. Una mossa che spalanca il mercato e che solo un’azienda veterana poteva attuare.
E alla partita si aggiunge anche Meta, che presenta Meta AI, un nuovo assistente potenziato dal modello Llama2, che includerà anche un sistema di text-to-image chiamato Emu.
Insomma, se pensavate di avere capito tutto, mettetevi comodi.
🎶 La musica di questa puntata è Bella Notte di Ludovico Einaudi
Benvenuti alla puntata numero 192 de “Il Bernoccolo”, il podcast che parla di comunicazione, tecnologia e cultura nel mondo post-digitale. Questa puntata è stata registrata il 29 Settembre 2023.
Con Andrea Ciulu e Pasquale Borriello.
I link commentati in questa puntata
Google nears release of AI software Gemini, The Information reports
A Silicon Valley Supergroup Is Coming Together to Create an A.I. Device