DeepSeek lancia Janus PRO per generare immagini

Pochi giorni fa annunciavo l’avvento di DeepSeek il nuovo LLM made in China Open Source che nella giornata di ieri ha provocato un vero e proprio disastro in borsa per i concorrenti americani.

Ora DeepSeek annuncia il lancio di Janus Pro 7B, un modello che non solo comprende i contenuti delle immagini, ma è anche in grado di generarle.

Janus Pro 7B è un modello AI multimodale, cioè che non si limita solo all’elaborazione di testo o immagini, ma fa entrambe le cose.

Questo modello non solo interpreta le immagini, ma può anche generarne di nuove da una descrizione testuale. Ad esempio, potresti scrivere “un gatto in skateboard al tramonto” (molto meglio se lo scrivi in inglese) e te lo disegnerà. Per ora con una risoluzione di 384×384 pixel, qualcosa di più limitato se lo confrontiamo con strumenti come Midjourney o DALL-E , che puntano più in alto in termini di qualità visiva.

Fino ad ora, i modelli multimodali dovevano essere suddivisi tra comprendere e generare, sacrificando l’efficienza lungo il percorso. Janus Pro ha risolto questo dilemma con quella che chiamano architettura “dual-track”. Fondamentalmente separano i processi di comprensione e creazione delle immagini in modo che non interferiscano tra loro, ma mantengano un unico sistema che organizza tutto: un trasformatore unificato.

Janus Pro 7B è open source, il che significa che chiunque può utilizzarlo, modificarlo e adattarlo alle proprie esigenze. La sua licenza MIT è una delle più permissive, ma attenzione: ha anche una licenza specifica DeepSeek che impone alcune restrizioni etiche, come vietarne l’uso militare o per la creazione di disinformazione.

Se stai cercando immagini ad altissima risoluzione o una grafica strepitosa per i giochi, questo non è il modello che fa per te. Ma se apprezzi la velocità e la versatilità in un piccolo pacchetto, Janus Pro è un’opzione molto interessante.

Per ora potete utilizzare questo modello all’interno di Hugging Face. Nella parte superiore trovate il modello per richiedere informazioni da immagini caricate, sotto il generatore di immagini.

Nell’esempio sopra ho inserito questo prompt: “8K quality photo style a scientific laboratory with the city of Paris in the background”

https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

Articoli Correlati

Emergenza Coronavirus COVID-19: notizie e provvedimenti

Ordinanza del 2 giugno 2021 Ulteriori misure urgenti in materia di contenimento e gestione dell’emergenza epidemiologica da COVID-19. 

Ordinanza 29 maggio 2021 Ai fini del contenimento della diffusione del virus Sars-Cov-2, le attività economiche e sociali devono svolgersi nel rispetto delle “Linee guida per la ripresa delle attività economiche e sociali”, elaborate dalla Conferenza delle Regioni e delle Provincie autonome, come definitivamente integrate e approvate dal Comitato tecnico scientifico, che costituiscono parte integrante della presente ordinanza

Ordinanza 21 maggio 2021 Protocollo condiviso di aggiornamento delle misure per il contrasto e il contenimento della diffusione del virus SARS-Cov-2/COVID-19 negli ambienti di lavoro.

Ordinanza 21 maggio 2021 Linee guida per la gestione in sicurezza di attivita’ educative non formali e informali, e ricreative, volte al benessere dei minori durante l’emergenza COVID-19.

Ordinanza 21 maggio 2021 Ulteriori misure urgenti in materia di contenimento e gestione dell’emergenza epidemiologica da COVID-19.

Vuoi rimanere aggiornato sulle nuove tecnologie per la Didattica e ricevere suggerimenti per attività da fare in classe?

Sei un docente?

soloscuola.it la prima piattaforma
No Profit gestita dai

Volontari Per la Didattica
per il mondo della Scuola. 

 

Tutti i servizi sono gratuiti. 

Associazione di Volontariato Koinokalo Aps

Ente del Terzo Settore iscritta dal 2014
Tutte le attività sono finanziate con il 5X1000