|
Le vidéomètre oculaire, rappelons le, est un appareil qui permet le calcul des mouvements oculaires en même temps que celui des mouvements de la tête, lesquels sont obtenus par traitement des images de la scène explorée par une caméra solidaire de la tête. Le patient équipé du VOM explore à peu près la même scène que cette caméra, l'analyse informatique par réseaux de neurones artificiels des objets de la scène étant à rapprocher de notre propre analyse visuelle de cette scène. Lorsque cette dernière se déplace, elle génère ce fameux réflexe optocinétique dont la qualification de réflexe est discutable et ambiguë, car elle peut être mise en compétition avec le mécanisme de poursuite volontaire.
En développant le VOM, j'ai été surpris mais ravi de trouver une illustration de la même ambiguïté, que j'ai observé au niveau du mécanisme d'apprentissage des objets par le VOM, qui bien qu'il ne soit qu'un cerveau artificiel primaire et embryonnaire, est déjà instructif sur cet aspect. En effet, j'ai remarqué que le réseau de neurones mathématiques que j'utilisais pouvait adopter un comportement situé entre deux extrêmes, variable suivant l'hétérogénéité du décor. En deux mots, j'ai vu le VOM faire soit de la poursuite, soit de la détection de mouvement sans cible privilégiée.
Dans le premier cas, nous avons un décor plutôt pauvre mais fortement contrasté avec un, deux ou trois objets très bien identifiés par le VOM, du fait de leurs contrastes qui rendent stables les contours de leurs formes. Par exemple l'écran de l'ordinateur que j'observe équipé du capteur, et une feuille de papier posée sur mon bureau. Ces objets étant stables, le réseau de neurones les privilégie aux dépends de tous les autres objets de la scène, dont il calcule les positions sans les utiliser à cause du poids synaptique trop faible qu'il leur attribue. Dans ce cas, il est clair que le VOM fait de la poursuite des deux objets en question.
Dans le deuxième cas, nous avons un décor plutôt riche mais faiblement contrasté avec une myriade d'objets instables qui peuvent être par exemple des zones mal délimitées d'objets qui renvoient localement différents reflets de lumière diffuse. Il peut y en avoir des centaines, plus que le logiciel actuel, doué de peu de mémoire, ne saurait en analyser. Dans ce cas, les poids synaptiques des meilleurs objets du réseau se répartissent en grand nombre de façon assez homogène, car aucun objet n'est vraiment mieux défini qu'un autre. Il n'y a donc plus de poursuite possible, mais une espèce de traitement de bas niveau qui compense la mauvaise identification de la position de chaque objet par un effet de masse du réseau, lequel calcule grâce à cet effet une bonne valeur de la position de la caméra, en quelque sorte une moyenne.
La conséquence de cette alternative peut être observée sur le mouvement de nystagmus "informatique" sous jacent au calcul de la position de la caméra. Si l'on remplace la sortie du réseau par une sortie calculée à partir de la position du meilleur objet de la scène qu'elle explore, c'est à dire celui de poids synaptique le plus élevé à un instant donné, on s’aperçoit que dans le premier cas, les saccades sont rares mais régulières, alors que dans le deuxième cas, les saccades sont fréquentes et très irrégulières.
En conclusion, j'ai proposé à Erik Ulmer de nous inspirer dans un proche avenir de cette observation pour tester une identification éventuellement plus objective du degré de comportement réflexe qui préside au dit réflexe optocinétique. Cette méthode consisterait par exemple à calculer la dimension de complexité (ou de corrélation) du nystagmus, pour vérifier une hypothèse selon laquelle plus cette dimension est élevée, plus le réflexe prend le pas sur la poursuite, et inversement.
|