Marzo 2, 2024

Lamezia in strada

Trova tutti gli ultimi articoli e guarda programmi TV, servizi e podcast relativi all'Italia

Intelligenza artificiale per descrivere ai non vedenti tutto ciò che la telecamera cattura

Intelligenza artificiale per descrivere ai non vedenti tutto ciò che la telecamera cattura

Microsoft ha lanciato la piattaforma Androide Visione dell’intelligenza artificialeUn’applicazione rivolta alle persone non vedenti o con problemi di vista Usi intelligenza artificiale Per descrivere all’utente il mondo che lo circonda E aiutarti a muoverti. in pratica Tutto ciò che viene posizionato davanti alla fotocamera del cellulare può essere interpretato tramite l’app E la sua narrazione all’utente: dalla descrizione dell’ambiente e delle persone alla lettura di testi o al conteggio dei soldi, tra le altre possibilità.

L’app non è del tutto nuova, poiché è disponibile per Dipartimento di controllo interno da 2017ma il suo arrivo sui dispositivi Android include gli ultimi sviluppi di Microsoft nel campo dell’intelligenza artificiale e Nuovi lavori Ciò include resoconti più dettagliati dell’ambiente e la capacità dell’intelligenza artificiale generativa di porre domande specifiche sul contenuto di un documento scansionato e chiacchierare al riguardo.

AI Vision è gratuito e disponibile ora Google Apps. Ha ampliato il numero delle lingue in cui opera, sia nelle sue liste che in ciò che traduce e nella voce del narratore, per 18Compreso spagnoloE con piani per arrivare 36 L’anno prossimo. In questo modo vuole essere uno strumento che aiuta le persone non vedenti o con difficoltà. Nelle tue attività quotidiane Con un assistente AI in grado di descrivere e narrare ciò che la fotocamera mobile cattura.

Basta con Punta la fotocamera o scatta una foto Per ascoltare la descrizione. L’app consente inoltre di modificare il canale audio per ascoltare informazioni specifiche. L’intelligenza artificiale visiva può:

  • la gente: Riconosce gli amici e descrive espressioni e volti.
  • Breve testo: legge il testo così come appare davanti alla fotocamera.
  • documenti: Fornisce un’audioguida per prendere in mano una pagina stampata e leggerne ad alta voce il contenuto, oltre al formato originale. Abilita la chat con Seeing AI per trovare rapidamente informazioni.
  • prodotti: esegue la scansione dei codici a barre utilizzando i segnali audio come guida e semplifica l’individuazione e la scansione dei codici a barre per identificare i prodotti, nonché informazioni sulle date di scadenza e consigli sulla produzione, se disponibili.
  • in giro: Descrive l’ambiente e facendo clic su “Ulteriori informazioni” si genera una descrizione completa. Inoltre, l’utente può esplorare l’immagine muovendo il dito sullo schermo per ascoltare la descrizione e la posizione dei diversi oggetti.
  • soldi: Identificazione delle banconote e delle valute e del loro valore
  • Colori: Definizione e descrizione del colore percepito.
  • Grafia: Leggi il testo scritto a mano.
  • una luce: Emette un tono udibile che corrisponde alla luminosità dell’ambiente circostante.
READ  Le specifiche impiegheranno del tempo per arrivare, ma puntare a 128 GT/s