Questa chat di Google AI con te per descriverti qualsiasi foto, è fantastico

Questa chat di Google AI con te per descriverti qualsiasi foto, è fantastico

Google introduce una nuova funzionalità basata sull’intelligenza artificiale nell’applicazione Lookout: la visione assistita. Così le persone ipovedenti possono discutere con l’intelligenza artificiale per porle, attraverso diverse domande, tutti i dettagli dell’immagine.

Tramite la funzione Domande e risposte sull’immagine dell’app Google Lookout, puoi chattare con un’IA per chiederle di descrivere un’immagine

Descrivere un’immagine non è più una sfida troppo complicata per una buona IA. Tuttavia, Google è riuscita a portare questo concetto un ulteriore passo avanti per renderlo più funzionale e impressionante. Il colosso americano ha appena rivelato Funzione Picture & Answer nell’app per l’accessibilità Lookout – Visione assistita E siamo stati in grado di fare una breve demo durante Google I/O 2023 qualche giorno fa.

Il concetto è facilmente riassumibile: fai qualsiasi domanda per capire cosa c’è nella foto e l’IA ti dà ogni volta una risposta chiara. Lo scopo di questa funzione, e del monitoraggio in generale, è aiutare le persone ipovedenti a sapere cosa c’è in una foto o in un disegno. Da qui il concetto di domande e risposte, che significa domande e risposte. Lo spettacolo, aveva una piccola cosa piuttosto sorprendente.

In sostanza, carichi un’immagine sull’app e chiedi all’IA di descriverla. Quest’ultimo si esibirà e ti spiegherà cosa vediamo. Questa prima descrizione è efficace e può bastare se vuoi solo un breve riassunto. Tuttavia, per coloro che hanno bisogno di maggiori dettagli, è sufficiente porre una domanda, per iscritto o ad alta voce.

L’intelligenza artificiale risponde alle tue domande per descrivere l’immagine

Durante la demo all’I/O, Image Q&A di Lookout si è confrontato con un’immagine ed ecco la conversazione che ha avuto in seguito con l’utente umano.

intelligenza artificiale: In questa foto vedo un cane che corre sulla spiaggia. Vedo anche che ha una pallottola in bocca. Sullo sfondo vedo acqua, montagne e cielo.

umani: Cos’è una razza di cane?

intelligenza artificiale: Il cane è un bastardo.

umani: Il cane sembra allegro?

intelligenza artificiale: Sì, il cane è giocoso.

umani: Descrizione dell’oceano.

intelligenza artificiale: L’oceano è calmo e c’è una montagna sullo sfondo.

umani: Le onde sono grandi?

intelligenza artificiale: No, le onde sono piccole.

umani: Ci sono nuvole nel cielo?

intelligenza artificiale: Sì, c’è una nuvola nel cielo.

umani: La spiaggia è affollata?

intelligenza artificiale: No, la spiaggia è deserta.

La conversazione non è necessariamente delle più naturali, ma è abbastanza fluida e chiara da rappresentare una soluzione interessante per i non vedenti che sul Web spesso devono accontentarsi di brevissime descrizioni.

READ  NVIDIA GeForce NOW supporta Xbox Game Pass e Age of Empires IV

Lì hanno uno strumento con un grande potenziale per dare loro un’idea precisa dell’immagine.

Abbiamo fotografato la manifestazione in questione. Precisiamo solo che questa registrazione non è di alta qualità, era principalmente destinata a supportare la stesura di questo articolo.

Collegamento YouTubeIscriviti a Frandroid

Ricordiamo infine che Lookout è un’app disponibile da tempo sul Play Store. Questo strumento di accessibilità ha già diverse funzionalità interessanti per i non vedenti: lettura di carte commerciali e fedeltà o etichette, rilevamento del valore delle banconote e aiuto nella scansione di un documento.


Vuoi entrare a far parte di una community di appassionati? Il nostro disaccordo Vi dà il benvenuto, è un luogo di mutua assistenza e passione per la tecnologia.

You May Also Like

About the Author: Adriano Marotta

"Pluripremiato studioso di zombi. Professionista di musica. Esperto di cibo. Piantagrane".

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *