|
Dans
le premier numéro nous avions abordé des aspects purement techniques du
vidéomètre oculaire (VMO ou VOM en anglais). Nous décrivons ici comment
cet appareil permet de mesurer simultanément les mouvements de l’œil
et de la tête, par l’analyse des images du décor provenant d’une
caméra solidaire de la tête.
Le VMO analyse les objets contenus dans le décor en effectuant un
apprentissage automatique de ces objets et de leur position absolue afin
de calculer en temps réel à 25Hz l’orientation de la caméra, par
reconnaissance de ces objets. De tels objets du décor sont simplement des
éléments contrastés qui servent de référence positionnelle au VMO
tout comme le fait notre propre système visuel lorsque nous générons
des saccades nystagmiques en tournant la tête. Nous savons alors que la
phase lente correspond à la fixation de l’objet, et que la saccade
correspond à la transition d’un objet à l’autre. L’œil conserve
ainsi une vision nette du décor. Le VMO utilise le même principe pour
faire de même, sauf que dans son cas il se sert de plusieurs objets à la
fois. En effet le VMO n’a pas de vision fovéale, mais il a une vision
périphérique très perfectionnée. Il peut reconnaître plusieurs objets
simultanément, et lorsque ceux-ci quittent son champ de vision, il peut
reconnaître ou apprendre simultanément plusieurs nouveaux objets.
Lorsque le VMO voit pour la première fois le décor qu’on lui présente
il apprend les nouveaux objets et mémorise leur position avec une
précision d’autant plus grande que la tête aura tourné plus
lentement. Lorsqu’il revoit ces objets pour la deuxième fois, le VMO
reconnaît alors ces objets quelle que soit la vitesse de rotation de la
tête. Un décor complet, comme celui d’un cabinet médical, peut ainsi
être analysé puis mémorisé définitivement sur l’ordinateur. Pour
parvenir à ce résultat, le VMO utilise une nouvelle technologie de
traitement d’images qui met en œuvre un réseau de neurones
mathématiques. Chaque objet du décor n’étant en fait rien d’autre
qu’un contour instable, complexe, inconnu par avance et mal défini, il
est pris en charge par un ensemble de neurones dont les connexions s’établissent
pendant l’apprentissage initial, et se modifient en se renforçant ou en
s’affaiblissant à chaque fois que l’objet est reconnu par la caméra.
Cette évolution des poids synaptiques permet au logiciel d’accrocher
des objets utiles et de rejeter les objets nuisibles, par exemple les
objets en mouvements ou trop faiblement contrastés, ce qui permet une
adaptation à n’importe quel décor. Une couche intermédiaire de
neurones de voisinage permet une reconnaissance des très petits objets.
L’avantage technologique de ce type de neurones visuels, par rapport aux
traitements d’image classiques, est l’exploitation de la complexité
du décor comme un avantage, au lieu de la subir comme génératrice de
bruits ou d’artefacts. Son avantage biomédical est d’être le
système le plus adapté par nature à l’analyse des mouvements couplés
de l’œil et de la tête, puisqu’il est lui-même un œil artificiel
en mouvement qui observe le décor comme le fait notre œil. Il est à
prévoir que cette propriété va conduire dans un proche avenir à faire
du VMO l’instrument de découvertes biomédicales très intéressantes
sur le couplage œil/tête, en particulier dans le cas des mouvements
rapides de la tête, qui ne sont pas accessibles avec les autres
technologies (fauteuils asservis, accéléromètres…).
|