Институт искусственного интеллекта Аллена (Пол Аллен — партнер Билла Гейтса по Microsoft) работает над новой системой поиска научных статей Semantic Scholar, которая позволит учитывать содержание статьи при поиске, а не просто искать по набору слов. О новой системе рассказывает сайт Technology Review.

По словам Орена Этциони (Oren Etzioni), исполнительного директора Института Аллена, информация в научных статьях представлена разными способами и программное обеспечение Semantic Scholar обучено извлекать ее с использованием множества техник машинного обучения. «Чтобы не отстать от миллиона статей, выходящих ежегодно, вам требуется некоторый уровень понимания», — сказал он.

Обычного поиска по ключевым словам и каким-то заданным характеристикам вроде даты публикации уже недостаточно, поэтому поисковые машины оснащают искусственным интеллектом. Этим путем сейчас идут и другие системы. К примеру, если вы вобьете в поисковую строку «Яндекса» или Google запрос «Сколько лет Бараку Обаме», то вы сразу получите ответ, а не просто обычный набор ссылок, где встречаются эти слова.

Что касается научных статей, то семантическое обучение должно дать компьютерам возможность более глубоко понимать содержание материала. В частности, команда Института Аллена разрабатывает алгоритмы, которые будут способны читать графики и диаграммы в статьях и извлекать значения, заложенные в них. В конечном счете вы должны открыть статью о новом эксперименте и иметь выбор — прочитать ее самому или удовольствоваться сообщением поисковой системы о том, насколько эффективным оказался новый препарат, испытания которого описываются в статье.