Google
 

it » lavoro » informatica

In Risposta a

Re: Visione artificiale

di tirzanello
il Sat, 07 Jul 2007 18:47:00 +0200
newsgroups it.lavoro.informatica
message-id <f6og24$r7d$1@aioe.org>

cicap wrote:

> Io parlavo di reti neurali. 

ed io di reti neurali so poco o nulla! Anche se sarei curioso di 
approfondire la cosa!

> Volevo solo sottolineare la 
> crucialita' del training set per la rete neurale, e quanto e' delicata 
> questa fase.

ho un po' più di confidenza con i modelli probabilistici, ma credo che 
le reti neurali vengano usate in sostituzione!

> Quindi semprerebbe trattarsi di pre-processing in sostanza. Allineo le 
> immagini e poi le passo alla rete normalizzate, in modo da rendere la fase 
> di apprendimento piu' robusta.

si, questo è un approccio.

> Cmq dubito che sia un procedimento cosi' effettivo...rimane un euristica e 
> certamente bisogna ancora stare attenti a non portare immagini troppo 
> diverse.

bhe, per essere robusto è robusto.
Io tempo fa ho implementato un object tracking rotation invariant di un 
oggetto generico che funzionava in real time. La cosa era basata 
sull'histogram, ossia sulla quantità di colori presente e su un modello 
probabilistico che ne pesava le zone in cui questi colori dovevano esser 
presenti. Non avevo fatto un training vero e proprio, visto che prendeva 
la prima immagine e dalla prima immagine calcolava le zone di 
probabilità... in pratica lo si può considerare come training su 
un'immagine sola :-) e comunque era rotation invariant. Per farcelo 
stare in real time il confronto lo facevo con la prima immagine anzicché 
con la precedente.... e con tutto ciò funzionava (e funziona) benone, 
nonostante il processore e le memorie lentissime dell'automa su cui 
girava! Senza considerare poi la risoluzione della telecamera: era un 
200x300 o qualcosa del genere, che avevo ridimensionato a 20x30 per 
farlo adar più veloce! (impressionante il fatto che con 20x30 non 
diminuiva di molto le performances).
Comunque con il training set e modelli probabilistici (niente reti 
neurali, quindi) ho visto fare cose impressionanti, conosco gente che ci 
ricerca su ed ho visto fare cose spettacolari semplicemente basandosi 
sugli istogrammi, e con training set non allineati, con tonalità e 
colori differenti! uno spettacolo!
Invece ho visto miseramente fallire algoritmi basati sull'hough 
transform, che cercano di dare delle formule matematiche agli 
oggetti!!!! basta ruotare un po' la testa e non ti riconosce più!!!

> Se veramente riuscisse ad allinearle con precisione, beh allora 
> significherebbe che ha gia' riconosciuto la faccia e che tutto il resto non 
> serve ;) 

non è che allinea con precisione, allinea l'asse principale delle 
componenti selezionate. Ma questo è solo un modo d'utilizzo. Per 
catalogare le facce, dai uno sguardo all'egeinface, ad esempio anche su 
wikipedia: http://en.wikipedia.org/wiki/Eigenface
Per allinearli, comunque ci stanno vari approcci, ad esempio 
registrazioni iterative, tipo quelle basate su AAM o ASM di tim cootes 
(http://www.isbe.man.ac.uk/~bim/).
Insomma, le vie del signore sono infinite :-)
Però sono molto specifiche, fare una cosa *in generale* la vedo una cosa 
   alla fin fine possibile, ma...... ce n'è di strada da fare! E 
comunque è poco utile per applicazioni specifiche, tipo aereonautiche, 
spaziali, di videosorveglianza, etc.

Tutti i messaggi della discussione

Riferimenti