Tecnologie di riconoscimento

Riconoscimento automatico del volto

2 Tecnologie di riconoscimento

Benché i primi lavori di ricerca sul riconoscimento automatico del volto siano stati avviati fin dagli albori della Computer Vision, più di venti anni fa [47], l'attività nel campo ha conosciuto un nuovo e generalizzato rilancio in questi ultimi anni; le ragioni di questo fenomeno possono essere ascritte essenzialmente ai fattori seguenti:

la riapparizione dei classificatori adattativi a reti neurali, specializzati per le applicazioni in tempo reale;
la disponibilità di hardware di elevata potenza a costi contenuti;
le crescenti esigenze che emergono nello sviluppo di applicazioni legate alla sorveglianza e alla sicurezza.

Il grande interesse suscitato dalle applicazioni AFR ha così spinto la ricerca a proporre (o, in molti casi, riproporre) una grande varietà di tecniche per affrontare il problema, basate su presupposti di varia natura o rivolte a problematiche specifiche del riconoscimento del volto.

2.1 Classificazione in base all'input

Una prima importante classificazione delle tecniche utilizzate in AFR discende direttamente dal tipo di immagini che vengono presentate come input al processo di riconoscimento; si ha così un riconoscimento

da immagini fisse, oppure
da sequenze video.

Nelle applicazioni generiche di AFR vengono solitamente utilizzate immagini fisse del volto del soggetto da riconoscere o identificare; di norma, tali immagini vengono riprese in livelli di grigio, dal momento che il colore, quasi per nulla usato negli algoritmi, presenta un rapporto decisamente sfavorevole tra il differenziale di informazione veicolata e il carico computazionale aggiuntivo richiesto per la sua elaborazione.

In alcune applicazioni speciali, tuttavia, è richiesto il riconoscimento del volto di una persona presente in una scena complessa e variabile nel tempo, ripresa generalmente mediante sequenze video da telecamere (quale potrebbe essere, ad esempio, quella del pubblico in transito in un aeroporto). Tale circostanza pone, come è ovvio, la maggior quantità di ostacoli tecnici, principalmente per via non solo delle enormi risorse computazionali necessarie, ma anche – e in misura non irrilevante – della scarsa qualità delle immagini disponibili come input.

2.2 Classificazione in base alla posa

Nell'arco degli ultimi anni, le tecniche di AFR si sono sviluppate lungo tre direttrici principali, definite in base al contenuto delle immagini in input e, di conseguenza, alla natura degli algoritmi di estrazione delle informazioni ai fini del riconoscimento:

riconoscimento da viste frontali,
riconoscimento da viste di profilo,
riconoscimento da viste generiche.

La quasi totalità dei sistemi AFR opera su immagini a livelli di grigio, dove il soggetto viene ripreso frontalmente, o comunque con angolo di vista pressoché frontale; oltre venti anni di ricerche in questa categoria, che costituisce sicuramente l'approccio più classico al problema AFR, sono brevemente riassunti nella Sez. 3.

Il riconoscimento del profilo, quando considerato come task autonomo, ha importanza abbastanza marginale nell'identificazione del volto, almeno per quanto attiene alla ricerca AFR; tuttavia, esso può assumere una valenza primaria nella fase preliminare della ricerca sul database dei volti, sia come procedura di pre-elaborazione volta a ridurre il carico computazionale degli algoritmi principali, sia come modulo ausiliario in uno schema ibrido di riconoscimento (Sez. 7). In vista di determinate applicazioni, come per esempio il riconoscimento di volti da foto segnaletiche (Fig. 1), sono state peraltro sviluppate tecniche specifiche che utilizzano solamente il profilo del volto, ricostruito da una vista laterale del soggetto: tali tecniche sono discusse nella Sez. 4.


(a)		(b)

Fig. 1

Esempio di foto segnaletica [11], con vista frontale (a) e di profilo (b).

Gli algoritmi per il riconoscimento generico operano di norma in maniera decisamente più sofisticata che non i precedenti, prendendo in considerazione tutti quegli aspetti, sia fisici che geometrici e statistici, che possono essere significativi nel problema del riconoscimento e che, per la loro varietà, contribuiscono a rendere ardua a tutt'oggi una soluzione definitiva. Nonostante la estrema complessità delle tecniche richieste in questo contesto, è interessante tuttavia notare come la maggior parte dei contributi alla ricerca AFR negli ultimi anni, di cui alcuni esempi appaiono nella Sez. 5, tenda ad abbandonare l'approccio frontale classico per orientarsi invece verso il riconoscimento generico.

2.3 Classificazione in base alle informazioni estratte

Un terzo schema di classificazione delle tecniche di riconoscimento discende dalla natura delle informazioni estratte dalle immagini ed utilizzate dagli algoritmi, che possono essere suddivise in:

informazioni locali, oppure
informazioni globali.

Mentre i metodi locali ricorrono a tecniche standard di pattern recognition per estrarre e confrontare caratteristiche specifiche e isolate del volto, e sono prevalentemente usati nel riconoscimento frontale, i metodi globali (detti anche olistici) sono basati su dati aventi come supporto l'intera estensione dell'immagine, o comunque vaste regioni di essa: tecniche tipiche in questa categoria sono la correlazione, l'analisi delle componenti principali (PCA, Principal Component Analysis [46]), i sistemi di auto-facce (eigenfaces) o le funzioni a base radiale (RBF, radial basis functions), e sono prevalentemente utilizzate nei sistemi di riconoscimento generico (Sez. 5).

In una recente rassegna sugli studi di benchmark applicati alle tecnologie AFR [35] è stata tratta la conclusione che i metodi globali di tipo connessionistico (basati cioè su reti neurali artificiali) superano spesso di gran lunga in prestazioni sia i metodi locali a caratteristiche discrete sia quelli globali basati su correlazione.

In aggiunta e a completamento di quest'ultimo schema di classificazione, una menzione particolare va riservata all'idea, relativamente recente, secondo cui algoritmi ibridi, capaci cioè di combinare tecniche diverse di riconoscimento in serie o in parallelo, possano offrire risultati significativamente migliori (almeno sotto l'aspetto delle prestazioni, se non sotto quello del carico computazionale) che non le tecniche basate su un singolo approccio. Nel caso parallelo, ad esempio, i risultati prodotti da algoritmi di natura diversa vengono sottoposti a procedure distinte di classificazione, dalle quali viene poi sintetizzato il risultato finale. Di fatto, i metodi ibridi assumono importanza centrale nei sistemi AFR, poiché un accorto schema di combinazione dei risultati consente di minimizzare al meglio gli inconvenienti e le limitazioni dei singoli algoritmi.

Riconoscimento automatico del volto

© 1997-2003 Paolo Marincola (Rome, Italy)
e-mail: pmaNOSPAM@acm.org (eliminare i caratteri "NOSPAM" per ottenere l'indirizzo esatto)
Commenti, osservazioni e suggerimenti sono estremamente graditi.

Last revised: 2003-12-06 22:37