Tutte le novità su Gemini, l’AI in Android e gli strumenti per i creativi
4′ di lettura
A presentare i vari aggiornamenti relativi ai modelli Gemini annunciati in occasione dell’I/O 2024 ci ha pensato, fra gli altri, Demis Hassabis, il Ceo di Google DeepMind, e cioè l’unità operativa che più da vicino “mastica” l’intelligenza artificiale nei laboratori di sviluppo di Mountain View. La base di partenza del percorso finora affrontato da BigG è stato il lancio, risalente a dicembre scorso, del primo modello nativamente multimodale Gemini 1.0 in tre diverse versioni: Ultra, Pro e Nano, a cui è seguito non molto tempo fa il debutto della release 1.5 Pro, caratterizzata da migliori prestazioni e capacità di ragionamento multimodale. Il menu delle novità in rampa di lancio preparato da Google si compone ora di Gemini 1.5 Flash, un modello più leggero rispetto a 1.5 Pro e progettato per essere veloce e più facilmente distribuibile a scala. Altre innovazioni (già testate) che troveranno senso compiuto più avanti sono Gemma 2, la nuova generazione di modelli aperti che sfrutta anche una nuova architettura dedicata, e Project Astra, gli assistenti di AI che affiancheranno gli utenti nella vita quotidiana (attraverso lo smartphone o un paio di occhiali intelligenti) con doti estremamente avanzate per recepire e ricordare ciò che vedono, comprendere il contesto e agire imparando dal dinamismo dell’ambiente in cui operano.
Gemini 1.5 Flash, il modello più veloce
Loading…
È l’ultimo nato della famiglia di modelli Gemini e quello che Google definisce essere anche il più veloce disponibile tramite Api: alle sue prerogative si aggiunge il fatto di essere ottimizzato per attività ad alto volume e di disporre della finestra di contesto lunga. Anche se meno potente della versione 1.5 Pro, le capacità di ragionamento multimodale su grandi quantità di informazioni sono comunque di elevatissimo profilo e fra i suoi principali pregi vi sono le doti di sintesi nelle applicazioni di chat, nelle didascalie di immagini e video e nell’estrazione di dati da selezionati documenti e tabelle lunghi e altro ancora. Il segreto di questo modello? È stato addestrato (da 1.5 Pro) attraverso un processo chiamato “distillazione”, secondo cui le conoscenze e le competenze più essenziali di un modello più grande vengono trasferite a un modello più piccolo ed efficiente.
Gli aggiornamenti per 1.5 Pro e Nano
Dell’estensione della finestra contestuale a due milioni di token della versione più potente del modello di Gen AI di Google si è detto già molto nei mesi scorsi ed è forse per questo che l’ultima versione di 1.5 Pro sposta l’attenzione su altri domini, a cominciare da ragionamento, codifica e comprensione di immagini e video. Il modello è ora in grado di seguire istruzioni sempre più complesse e articolate, comprese quelle che specificano il comportamento a livello di prodotto. Il risultato finale è un controllo sulle risposte migliore quando si usa questo strumento per casi d’uso specifici, come creare la personalità e lo stile di risposta di un agente di chat o automatizzare i flussi di lavoro attraverso più chiamate a funzioni.
Continua la lettura su: https://www.ilsole24ore.com/art/tutte-novita-gemini-l-ai-android-e-strumenti-i-creativi-AFQxsx0D Autore del post: Il Sole24Ore Tecnologia Fonte: https://www.ilsole24ore.com/