Google presenta una nuova versione in grado di gestire audio, video e testi molto meglio di GPT-4
In una presentazione organizzata da DeepMind, Gemini Pro 1.5 ha analizzato un file PDF di 402 pagine contenente registrazioni di conversazioni importanti dell'Apollo 11. Quando è stato chiesto di cercare "clip divertenti" nel documento, il modello ha individuato diverse clip, tra cui una in cui gli astronauti hanno ritardato le conversazioni per una pausa pranzo. In un'altra presentazione, il sistema Google era in grado di rispondere a domande diverse su scene specifiche di un film di Buster Keaton. La versione precedente di Gemini era in grado di rispondere solo a domande su testi o video molto più brevi. Google spera che le nuove funzionalità consentano agli sviluppatori di creare nuove applicazioni. "Il modo in cui il modello fa questo tipo di inferenza su ogni singola pagina e ogni singola parola è davvero magico", commenta il ricercatore di DeepMind Oriol Vinyals.
Google afferma che Gemini Pro 1.5 è in grado di elaborare e comprendere il contenuto video per un'ora, file audio per 11 ore, 700.000 parole o 30.000 righe di codice in una sola volta, superando di gran lunga le capacità dei modelli di intelligenza artificiale come GPT-4 di OpenAI che alimenta ChatGPT. Il gigante non ha rivelato i dettagli tecnici che hanno reso possibile questo risultato. Tuttavia, Hassabis ha annunciato che una delle applicazioni testate dai ricercatori di Google DeepMind è stata l'individuazione di punti salienti nelle discussioni su Discord con migliaia di messaggi.
Gemini Pro 1.5 ha prestazioni migliori, come dimostrato dal risultato ottenuto dal modello in diversi indicatori di prestazione. Il nuovo sistema beneficia di una tecnologia sviluppata dai ricercatori di Google per migliorare le prestazioni senza aumentare la potenza di calcolo. L'approccio, noto come "mixture of expert", attiva selettivamente parti dell'ingegneria del modello più adatte per risolvere una determinata attività, rendendo l'addestramento e l'esecuzione più efficienti.
Google annuncia che Gemini Pro 1.5 è in grado di svolgere un numero equivalente di compiti rispetto al suo prodotto più potente, Gemini Ultra, anche se è un modello molto più piccolo. Hassabis ha anche sottolineato che non c'è motivo di non applicare la tecnologia utilizzata per migliorare Gemini Pro anche a Gemini Ultra.
La versione aggiornata di Gemini Pro sarà resa disponibile agli sviluppatori tramite AI Studio, una piattaforma di test progettata per testare le capacità del modello, oltre a un'API per la piattaforma di cloud computing Vertex AI di Google. Finora non c'è una data definita per il lancio ufficiale.
Google sta anche introducendo nuovi strumenti per aiutare gli sviluppatori a utilizzare Gemini nelle loro applicazioni, tra cui nuovi modi per sfruttare le capacità di analisi audio e video del modello. La società ha anche annunciato di aggiungere nuove funzionalità basate su Gemini al suo strumento di sviluppo web basato sul web, Project IDX, come la correzione multimediale e la verifica del codice.
Correndo a velocità estrema:
La rapida iterazione di Google su Gemini è un segno della corsa sfrenata verso l'oro nel campo dell'intelligenza artificiale catalizzata dal successo di ChatGPT. All'inizio di questa settimana, OpenAI ha annunciato di aver dotato ChatGPT della capacità di ricordare le informazioni utili inserite dagli utenti nel lungo termine. La settimana scorsa, Google ha rinominato il suo chatbot Bard e ha annunciato che Gemini Ultra sarà disponibile con un abbonamento a pagamento.
La rapida avanzata dell'intelligenza artificiale produttiva contrasta con le preoccupazioni per i rischi che la tecnologia potrebbe comportare. Google afferma che Gemini Pro 1.5 è stato sottoposto a test completi e che l'accesso limitato è un modo per raccogliere feedback sui rischi potenziali. La società afferma anche di aver concesso l'accesso ai suoi modelli più potenti ai ricercatori dell'Istituto per la Sicurezza dell'Intelligenza Artificiale nel Regno Unito per testarli.
Nel frattempo, Hassabis spera di fare ulteriori progressi nei prossimi mesi: "È un ritmo diverso - dice -. Sto cercando di portare la mentalità di una startup nell'azienda".
| Sosteneteci con un contributo di qualsiasi entità.
Il vostro sostegno è fondamentale per consentirci di continuare a offrire giornalismo di qualità accessibile al pubblico globale. Ogni contributo, grande o piccolo, riveste un'importanza cruciale per la nostra missione e per i nostri lettori. Insieme, ci impegniamo affinché il profitto non sia mai il nostro obiettivo principale, ma piuttosto un sostegno indispensabile per perseguire la nostra missione senza essere legati alle esigenze di investitori esterni Questo ci consente di concentrarci pienamente sulla qualità e sull impatto culturale che desideriamo raggiungere.
Un contributo di €5 al mese equivale a 1,25€ a settimana.