In Risposta a
Re: Visione artificiale
di tirzanello
il Sat, 07 Jul 2007 18:47:00 +0200
newsgroups it.lavoro.informatica
message-id <f6og24$r7d$1@aioe.org>
cicap wrote:
> Io parlavo di reti neurali.
ed io di reti neurali so poco o nulla! Anche se sarei curioso di
approfondire la cosa!
> Volevo solo sottolineare la
> crucialita' del training set per la rete neurale, e quanto e' delicata
> questa fase.
ho un po' più di confidenza con i modelli probabilistici, ma credo che
le reti neurali vengano usate in sostituzione!
> Quindi semprerebbe trattarsi di pre-processing in sostanza. Allineo le
> immagini e poi le passo alla rete normalizzate, in modo da rendere la fase
> di apprendimento piu' robusta.
si, questo è un approccio.
> Cmq dubito che sia un procedimento cosi' effettivo...rimane un euristica e
> certamente bisogna ancora stare attenti a non portare immagini troppo
> diverse.
bhe, per essere robusto è robusto.
Io tempo fa ho implementato un object tracking rotation invariant di un
oggetto generico che funzionava in real time. La cosa era basata
sull'histogram, ossia sulla quantità di colori presente e su un modello
probabilistico che ne pesava le zone in cui questi colori dovevano esser
presenti. Non avevo fatto un training vero e proprio, visto che prendeva
la prima immagine e dalla prima immagine calcolava le zone di
probabilità... in pratica lo si può considerare come training su
un'immagine sola :-) e comunque era rotation invariant. Per farcelo
stare in real time il confronto lo facevo con la prima immagine anzicché
con la precedente.... e con tutto ciò funzionava (e funziona) benone,
nonostante il processore e le memorie lentissime dell'automa su cui
girava! Senza considerare poi la risoluzione della telecamera: era un
200x300 o qualcosa del genere, che avevo ridimensionato a 20x30 per
farlo adar più veloce! (impressionante il fatto che con 20x30 non
diminuiva di molto le performances).
Comunque con il training set e modelli probabilistici (niente reti
neurali, quindi) ho visto fare cose impressionanti, conosco gente che ci
ricerca su ed ho visto fare cose spettacolari semplicemente basandosi
sugli istogrammi, e con training set non allineati, con tonalità e
colori differenti! uno spettacolo!
Invece ho visto miseramente fallire algoritmi basati sull'hough
transform, che cercano di dare delle formule matematiche agli
oggetti!!!! basta ruotare un po' la testa e non ti riconosce più!!!
> Se veramente riuscisse ad allinearle con precisione, beh allora
> significherebbe che ha gia' riconosciuto la faccia e che tutto il resto non
> serve ;)
non è che allinea con precisione, allinea l'asse principale delle
componenti selezionate. Ma questo è solo un modo d'utilizzo. Per
catalogare le facce, dai uno sguardo all'egeinface, ad esempio anche su
wikipedia: http://en.wikipedia.org/wiki/Eigenface
Per allinearli, comunque ci stanno vari approcci, ad esempio
registrazioni iterative, tipo quelle basate su AAM o ASM di tim cootes
(http://www.isbe.man.ac.uk/~bim/).
Insomma, le vie del signore sono infinite :-)
Però sono molto specifiche, fare una cosa *in generale* la vedo una cosa
alla fin fine possibile, ma...... ce n'è di strada da fare! E
comunque è poco utile per applicazioni specifiche, tipo aereonautiche,
spaziali, di videosorveglianza, etc.
Tutti i messaggi della discussione
Riferimenti