top of page

Comprensione della scena digitale

Immagine del redattore: Daniele RavìDaniele Ravì

Tesi di Dottorato

L'ampio volume di immagini condivise su siti web e archivi personali ha presentato sfide nella gestione massiva di multimedialità. A causa della conosciuta lacuna semantica tra la semantica di alto livello comprensibile all'uomo e le caratteristiche di basso livello generate dalla macchina, negli ultimi anni c'è stato un notevole sforzo di ricerca nella comprensione e nell'indicizzazione dei contenuti multimediali. Gli algoritmi di visione artificiale per singole attività, come il riconoscimento, la detection e la segmentazione degli oggetti, hanno ottenuto risultati impressionanti. La sfida successiva è integrare questi algoritmi e affrontare il problema della comprensione completa della scena, che implica il riconoscimento di tutti gli oggetti di interesse e la loro estensione o forma spaziale. La vera comprensione semantica di un'immagine riguarda principalmente la classificazione e la segmentazione semantica della scena. Il primo mira a determinare le categorie alle quali appartiene un'immagine, mentre il secondo fornisce un'etichetta semantica per ogni pixel, descrivendo la categoria di oggetto in cui appare. Le soluzioni per l'interpretazione semantica e la comprensione delle immagini permetteranno e miglioreranno una vasta gamma di applicazioni di visione artificiale. Mentre gli esseri umani possono eseguire questi compiti facilmente, la quantità pura di dati coinvolti può renderlo troppo faticoso per un computer. Questa tesi propone nuove approcci per la categorizzazione semantica della scena, la segmentazione e il recupero che consentono a un dispositivo con risorse limitate di comprendere automaticamente le immagini. Le soluzioni di visione artificiale proposte utilizzano algoritmi di machine learning per costruire sistemi robusti e riutilizzabili. Poiché l'apprendimento è un componente chiave dei sistemi di visione biologici, la progettazione di sistemi artificiali automatici che possono imparare è una delle tendenze più importanti nella ricerca attuale di visione artificiale.


Scarica la tesi di dottorato qui!

4 visualizzazioni0 commenti

Post recenti

Mostra tutti

Commentaires


bottom of page