jueves, 28 de noviembre de 2013

5 años de eye tracker en el DigiDoc y el Web Research Group

Pareciera que fue ayer cuando tuve por primera vez un eye tracker frente a mi y el reto de hacer un estudio sobre comportamiento de las personas ante los resultados de búsqueda. Nos habían prestado un Tobii de la serie 50 como premio a la mejor propuesta de investigación con eye tracker, era un premio que daba Alt64 en el congreso Interacción, creo que en el año 2009. Parece que se presentaron pocas propuestas... el  hecho es que lo ganamos! Recuerdo que no fue fácil, y que gracias a dos investigadores de Barcelona Media supimos preparar el experimento. Ganar ese premio no fue cualquier cosa, al menos para mi supuso un antes y un después en mi línea de trabajo en HCI (Human-Computer Interaction).
Un tiempo después (en 2011 si no recuerdo mal), pudimos tener nuestro propio eye tracker, de nuevo un Tobii de la serie 50. Y desde entonces lo hemos usado en la UPF tanto investigadores del grupo DigiDoc como del Web Research Group. Hoy hago un recuento de los trabajos que hemos publicado en estos años:

En principio nos interesaba sobre todo estudiar cómo se comportan ante la lista de resultados que da un buscador:
Luego lo ampliamos a cómo se comportan en el proceso de búsqueda completo:
Después probamos a aplicado a un estudio de interacción con TV conectada:
Ultimamente estamos estudiando factores culturales:
Y hemos hecho algun estudio más metodológico sobre diseño de experimentos con eye tracker:
  • Marcos, Mari-Carmen; Rello, Luz. Order effect y presencia de erratas en estudios de usuarios con eye tracking. Interacción 2013 (Madrid, 17-30 septiembre 2013).
Además hemos hecho varios estudios sobre lectura en pantalla, varios de ellos con grupos de usuarios con dislexia, en lo que Luz es la investigadora experta y en su web hay más trabajos sobre el tema:
Y también hemos hecho alguna investigación sobre lectura de noticias online:
  • Arapakis, Ioannis; Lalmas, Mounia; Cambazoglu, B. Barla; Marcos, Mari-Carmen;  Jose, Joemon M. "User Engagement in Online News: Under the Scope of Sentiment, Interest, Affect, and Gaze". JASIST (aceptado). 
  • Rovira, Cristòfol; Capdevila, Jofre; Marcos, Mari-Carmen. La importancia de las fuentes en la selección de artículos de prensa online: estudio de Google Noticias mediante eye-tracking. Investigación Bibliotecológica, 62 (aceptado).
En este momento (enero de 2015) tenemos entre manos 4 cosas:
  • un estudio con eye tracking orientado al marketing digital usando técnicas de neuromarketing (con Edgar Sánchez)
  • un estudio sobre el comportamiento visual de las personas en la lectura de mapas conceptuales (con Cristòfol Rovira).
  • un estudio sobre diferencias culturales que afectan a cómo las personas nos comportamos frente a un estudio de laboratorio, para lo que colaboramos de nuevo con una universidad de Dubai y enfocamos el estudio a un grupo de mujeres universitarias (con Ruth García y Pilar Medina)
  • y además tenemos pendiente publicar el estudio de rich snippets (con Ferran Gavín y Ioannis Arapakis), que lo habíamos enviado a un par de congresos internacionales pero lamentablemente no ha sido aceptado... así que seguiremos trabajando en él, como decía en mi artículo de ThinkEPI sobre "rejected papers"

Cómo funciona un eye tracker

Los seres vivos prestamos atención a aquello que está al alcance de nuestros sentidos. En este línea, existe abundante bibliografía que pone de manifestó la relación existente entre la atención que ponemos las personas y la mirada.

En función del registro de imágenes que hace la cornea, el sistema visual humano cuenta con tres niveles de percepción visual::
- la visión foveal es aquella que se registra de forma más nítida, y la que llega de los elementos a los que hemos prestado atención de forma más consciente, es la que usamos para la lectura, la conducción, y todas aquellas actividades en las que precisamos gran nitidez;
- la visión parafoveal es la que se registra en la zona que hay alrededor de la fóvea, y tiene menor nitidez que la anterior;
- en tercer lugar, la visión periférica es la que registra las imágenes que llegan a la zona más alejada de la fóvea, esta visión tiene menos resolución.

Cuando interactuamos con una interfaz realizamos continuamente movimientos con los ojos, se trata de movimientos muy rápidos  (hasta 500 movimientos por segundo) que se dan cuando cambiamos el foco de atención y se denominan “sacadas” (saccades en inglés), por otra parte cuando mantenemos la mirada fija en un lugar durante varios milisegundos se produce una “fijación”. Es así como en términos mecánicos podemos describir el proceso fisiológico de la observación visual como una alternancia contínua entre fijaciones  y  sacadas.

En la actualidad existe tecnología que permite registrar las fijaciones y sacadas del ojo humano, se trata del eye tracker. Este dispositivo detecta, sigue y graba los movimientos que realizamos con los ojos, la duración de la mirada y la dilatación de la pupila, medidas que podemos relacionar con la atención, por lo que lo hace una herramienta de gran utilidad para estudios de lectura, de comportamiento y de interacción entre las personas y las interfaces, entre otras cosas.

Para realizar este seguimiento ocular, los eye tracker actuales funcionan de forma remota, es decir, sin intervenir de forma intensiva en los ojos de las personas. La técnica más común hoy en día se conoce como Pupil Centre Corneal Reflection (PCCR); para aplicarla, el eye tracker incorpora un luz infrarroja y una cámara de vídeo. Cuando está activado, el dispositivo ilumina al usuario con dos proyecciones de rayos infrarrojos que generan un reflejo en las córneas de los ojos, concretamente en la fóvea, que es una pequeña zona de la retina donde registramos la visión más nítida. Una cámara de vídeo integrada en el equipo de eye tracker recoge esos reflejos junto con la posición del usuario y, mediante procesamiento digital de la imagen, se extrae la ubicación de las pupilas en un ratio de 50 Hz o superior. Hecho esto, la posición de las pupilas se mapea con la ubicación de la mirada en la pantalla, y de esta forma se puede saber dónde tiene la persona puesta su atención en cada momento de la grabación.