Se ha creado un algoritmo que dota a las máquinas con la capacidad de ver imágenes como lo hacemos los seres humanos. Como sabemos, el ojo humano siempre se siente atraído por unas partes y no otras de una imagen. La atención que ponemos al mirar se dirige a unos puntos antes que a otros.
El algoritmo o modelo computacional es obra de un grupo de investigadores del Centro de Investigación en Tecnologías de la Información (CiTIUS) de la Universidad de Santiago de Compostela, que lo han bautizado con el nombre de AWS (Adaptive Whitening Saliency, algo así como Saliencia por Blanqueado Adaptativo). La idea de saliencia, es decir, de prominencia, hace alusión a los elementos más vistosos o llamativos de la imagen. Este modelo de atención visual es capaz de predecir en qué puntos vamos a fijarnos los humanos cuando miramos una imagen o, lo que es lo mismo, qué áreas de una escena, incluso en movimiento, muestran más probabilidades de captar nuestra atención.
Nuestro instinto nos lleva a buscar el centro de la imagen despreciando los elementos periféricos. Esto sucede así aunque el centro de la imagen esté vacío. Solamente pasados unos pocos segundos la mirada se desplaza al entorno y después, si acaso, a los elementos marginales, el llamado ruido visual.
Este comportamiento de la atención visual es producto de un complejo mecanismo óptico y neuronal enraizado en la evolución natural de la especie. Sobre esta base, el robot programado con el algoritmo diseñado en CiTIUS es capaz de adoptar el comportamiento neuronal del humano identificando así los puntos más relevantes para nosotros. Ahora bien, ¿cuál es la utilidad de este algoritmo? Sucede que uno de los retos más importantes para el desarrollo de la inteligencia artificial es la exigencia de discriminar entre los datos relevantes y los superfluos. Pues bien, este algoritmo permite satisfacer esta necesidad en el ámbito del reconocimiento tecnológico de imágenes.