Изучать человеческий разум очень сложно. Можно спросить людей, как они думают, но они обычно не знают, можно сканировать их мозги, но инструменты несовершенны. Даже простая на первый взгляд задача — как люди учатся узнавать буквы — оставляет ученых в недоумении. Теперь психологи используют искусственный интеллект (ИИ), чтобы исследовать, как работают наши умы. Марко Зорзи (Marco Zorzi), психолог из Университета Падуи в Италии, использовал искусственные нейронные сети, чтобы показать, как мозг может «захватить» уже существующие связи в зрительной коре, чтобы распознать буквы алфавита. Доктор Зорзи рассказал Science о своей работе.
Вопрос: Что вы узнали в своем изучении восприятия букв?
Ответ: Мы сначала обучали модель на участках образов природы, деревьев и гор, а затем это знание становится лексикой основных визуальных функций, которые сеть использует, чтобы узнать о формах букв. Эта идея «нейронной рециркуляции» обсуждается уже некоторое время, но, насколько я знаю, это первая демонстрация, на которой действительно что-то получено: мы видели лучшее распознавание букв в модели, которая обучалась на образах природы, по сравнению с той, что не обучалась. Утилизация заметно ускоряет изучение букв, по сравнению с той же сетью, но без использования «повторной переработки». Это дает сети преимущество.
В: Как работает обучение?
О: Используется «неконтролируемое» обучение. После предварительной тренировки на изображениях природных объектов мы даем нейронной сети необозначенные изображения букв. Цель состоит в том, чтобы просто построить внутреннюю модель данных, чтобы найти скрытую структуру. Это называется «генеративным» потому, что генерируются шаблоны сверху вниз. При этом сеть использует уже полученные знания для интерпретации новую входящей сенсорной информации.
Позже, более простой алгоритм учится размещать буквенные надписи на выходе сети. Этот алгоритм использует «контролируемое» обучение, — т.е. мы ему говорим, что правильно и что неправильно, — однако большая часть работы была выполнена с помощью неконтролируемого алгоритма.
В: Почему основное внимание уделяется неконтролируемому обучению, которое гораздо менее распространено в ИИ?
О: Контролируемое обучение предполагает, что у вас есть учитель, который всякий раз указывает на ошибки и верные решения. Подумайте, как мы, люди, учимся. Так редко бывает в жизни.
Подконтрольное обучение предполагает упреждающий подход, от частного к общему, в отличие от неконтролируемого обучения, основанного на подходе «от общего к частному». В мозгу много цепей с обратной связью. Более того, в мозге есть внутренняя активность, которая стала одним из наиболее интересных результатов последних 20 примерно лет в нейровизуализации. Она не вызвана сенсорными стимулами. Внутренняя активность может быть вызвана только активацией нейронов в верхних слоях, а затем распространением этой активности взад и вперед по сети. Ее можно охарактеризовать как своего рода «мечты» или «воображение». В сочетании с сенсорной деятельностью обратная связь сверху вниз приводит к интерпретации ввода. Например, если написанное слово видно не полностью, читатели могут заполнить пробелы сообразно своим ожиданиям.
Другое преимущество неконтролируемого обучения — поскольку нет конкретной задачи, знания не привязаны к конкретному применению. Легко освоить новую задачу, используя эти знания более высокого уровня. Например, изучение того, что означает число, позднее применяется в обучении арифметике.
В: Часть вашей сети, обученная на образах природных объектов была более восприимчива к изображениям существующих букв, нежели выдуманных. Означает ли это, что настоящие буквы как-то напоминают природу?
О: Да, это одно из возможных объяснений. Уже некоторое время существует гипотеза, что формы символов во всех системах письма были выбраны культурой, с тем, чтобы лучше соответствовать характеристикам нашей визуальной среды. Об этом можно думать в категориях типов фигур, более соответствующих мозгам, «обученных» на образах окружающей природы.
В: Что еще вы узнали о человеческом познании?
О: Мы знаем, что дети и животные могут сравнивать количества объектов даже без особых обозначений. Мы обнаружили, что глубокое неконтролируемое обучение на изображениях, содержащих различные количества объектов дает нейронной сети это чувство числа. Это было первое исследование с использованием глубокого обучения для моделирования когнитивных процессов.
В случае с нейронными сетями у вас есть алгоритм обучения. Вы можете попытаться сопоставить траекторию обучения сети с данными человеческого развития. Возьмите что-нибудь вроде обучения чтению. Если у вас есть компьютерная модель, которая учится читать, вы также можете попытаться понять атипичное обучение, как в случае дислексии.
В: Что вы узнали о дислексии?
О: Идет масштабный спор. Каков дефицит лежит в основе явления? Люди рассматривали фонологические, визуальные и недостатки внимания. Мы протестировали эти гипотезы в компьютерной модели развития чтения. В исследовании, которое еще не опубликовано, мы заметили, что если вы не принимаете, что дислексия вызвана более чем одним дефицитом, невозможно объяснить разнообразие реальных детей с дислексией. Этот подход движется к к попыткам построить персонализированные модели и использовать моделирование для прогнозирования результатов вмешательства.
В: Могло ли такого рода симулирование работы мозга также улучшить ИИ?
О: Думаю, да. Если учесть больше ограничений из информации, которую мы имеем о мозге и как люди учатся, мы можем получить некоторые новые идеи о том, как исследовать новые учебные решения.