Исследователи НИУ ВШЭ Юрий Марков и Наталья Тюрина выяснили, что при зрительной оценке размеров объектов человек способен также учитывать их удаленность от наблюдателя, даже если этих объектов достаточно много. При этом наблюдатель опирается не только на проекцию объектов на сетчатке, но и на окружающий контекст. Статья опубликована в журнале Acta Psychologica.
Многочисленные исследования в области зрительной «ансамблевой статистики» доказали, что человек способен визуально оценить статистические характеристики множества объектов очень быстро и достаточно точно. Задержав взгляд на группе объектов на доли секунды, наблюдатель может оценить как простые свойства этого множества (средний размер набора кружков), так и сложные (среднюю эмоцию группы людей на фото или среднюю стоимость группы товаров).
Одним из самых часто исследуемых признаков в подобных исследованиях является размер объектов. Но в лабораторных условиях объекты предъявляются на плоском экране, а в реальной жизни предметы имеют определенный контекст, в том числе характеризующий расстояние от наблюдателя.
В зрительной системе существуют две разных репрезентации размера: «сетчаточные» размеры — физическая проекция объекта на сетчатку - и «воспринимаемые» размеры — «перемасштабированные» размеры объектов с учетом расстояния до них. Например, сетчаточные размеры двух чашек чая, одна из которых стоит далеко, а другая близко, будут разными. Однако их воспринимаемые размеры будут равны, так как мы знаем, что причина разных размеров — в расстоянии, а не в различиях между чашками.
До сих пор неизвестно, на основе каких размеров происходит оценка статистических свойств группы объектов — «сетчаточных» или «воспринимаемых». Иными словами, способна ли зрительная система «перемасштабировать» размеры группы предметов с учетом расстояния прежде, чем оценить их средний размер?
Чтобы это выяснить, исследователи провели эксперименты с предъявлением объектов на разной глубине. В первом эксперименте исследователи показывали объекты на разной глубине при помощи стереоскопа — устройства, которое при помощи зеркал позволяет предъявлять в разные глаза картинки с небольшим сдвигом, тем самым задавая изображениям глубину (схожая техника используется в 3D-кинотеатрах).
Во втором эксперименте исследователи использовали иллюзию Понцо, которая также позволяет манипулировать глубиной.
Иллюзия Понцо состоит в том, что верхняя из двух равных по размеру линий, расположенных на фоне с линейной перспективой, воспринимается больше нижней. Все потому, что мозг «перемасштабирует» размеры этих линий, считая, что одна из них расположена дальше другой.
В обоих экспериментах ученые показывали испытуемым объекты разных размеров на разной глубине и просили их оценить вариативность объектов на экране. В части проб маленькие объекты были близко, а большие далеко (положительная корреляция между размером и расстоянием), в других пробах — наоборот (отрицательная корреляция).
На рисунке 2: слева — проба с положительной корреляцией между размером и расстоянием, справа — с отрицательной. Может показаться, что слева вариативность размеров больше, чем справа. Но на самом деле кружки имеют одинаковые размеры на обеих картинках.
Если оценка вариативности размеров кружков происходит по «сетчаточным» размерам, то разницы в ответах между пробами с положительной и отрицательной корреляцией не будет. Но если оценка происходит по «воспринимаемым» размерам, то при положительной корреляции (на картинке слева) кружки будут восприниматься как имеющие большую вариативность из-за действия иллюзии Понцо.
Результаты обоих экспериментов подтвердили, что оценка происходит по «воспринимаемым» размерам — испытуемым казалось, что при положительной корреляции кружки имеют больший разброс размеров по сравнению с отрицательной.
Эти результаты говорят о том, что зрительная система способна быстро и автоматически оценивать статистические характеристики группы объектов, предварительно перемасштабировав их с учетом расстояний.
«Судя по всему, перемасштабирование размеров относительно их удаленности происходит очень быстро и очень рано в зрительной системе, — комментирует один из авторов исследования Юрий Марков. — Информация о сцене обрабатывается в высокоуровневых структурах мозга и при помощи процесса “сверху-вниз” регулирует активность нейронов, которые отвечают за оценку размера объектов на более ранних этапах обработки. И только затем происходит вычисление ансамблевых статистик».
Помимо фундаментальной ценности, этот вывод может также помочь в более грамотном проектировании сложных VR/AR сред, в которых информация может предъявляться на разной удаленности для пользователя.
Информация и фото предоставлены пресс-службой НИУ ВШЭ