Информатика для нас не проблема. "В мире науки" №11, 2017

24.11.2017 20:28

6743

Информатика для нас не проблема. "В мире науки" №11, 2017

Этим летом исполнилось 34 года одному из российских флагманов в области информатики и вычислительной техники — Институту проблем информатики Российской академии наук. Больше 18 лет им руководит академик Игорь Анатольевич Соколов.

— Игорь Анатольевич, с чего начинался ваш поход в математику и информатику?
— Я родился в Тамбове, после окончания средней школы в 1971 г. приехал поступать в МГУ на новый факультет вычислительной математики и кибернетики. Потом были аспирантура и кандидатская диссертация, посвященная случайным процессам в дискретном времени. В СССР за то, что сейчас называется информационными технологиями, отвечало Министерство промышленности средств связи. В зоне его ответственности было производство вычислительной техники, связного оборудования и т.д. Министр Э.К. Первышин в середине 1970-х гг. принял очень верное решение — ввести в эту отрасль свежую силу, молодых математиков. Совместно с Академией наук СССР был создан специальный отдел, в который набрали выпускников ВМК, мехмата МГУ и Физтеха. Задачей совместного отдела были научные исследования в области систем и оборудования связи — моделирование, конструирование устройств, создание для них программного обеспечения, написание протоколов и т.д. Все это было поставлено на очень серьезный уровень. Многие даже сегодняшние работы проходят на уровне значительно более низком.
— С математической точки зрения?
— Разумеется. Для математики тогда был поистине райский период. Работы были большей частью нацелены на специальную, оборонную тематику, но были и очень интересные гражданские задачи. Однако уже в конце 1980-х гг. в нашей
стране начались необратимые изменения. Работы по спецтематике начали сворачиваться.
— И ваш отдел сократили?
— Нас никто не сокращал, но работать стало не интересно. Я перешел в недавно созданный Институт проблем информатики (ИПИ) АН СССР. Там прошел все ступени от научного сотрудника до заместителя директора по научной работе. В 1999 г.
меня избрали директором.
— Сам институт тоже был создан на пике интереса к математике?
— И да, и нет. Это был ответ на вызов времени. В 1980-х гг. пришло понимание, что вычислительная техника — самостоятельная отрасль и промышленности, и науки. Первым директором ИПИ стал Б.Н. Наумов. Перед институтом специальным постановлением ЦК КПСС была поставлена задача проведения прикладных исследований в области вычислительной техники и программирования. Постановление было обширное, касалось всей отрасли, но судьба нашего ИПИ в нем была прописана отдельной строкой. И эта судьба тогда была достаточно привлекательной. Ядро, центральная часть располагалась в Москве, а в других городах СССР, где планировалось производство вычислительной техники и того, что с ней связано, создавались наши филиалы.
В Орле строился завод управляющих вычислительных машин. Предполагалось, что он будет производить современную периферию: принтеры, сканеры и т.д. Соответственно, в городе создавался наш филиал. В Казани другой филиал должен был осуществлять научное сопровождение работ Казанского производственного объединения вычислительных систем. В Бердянске была построена мощная полиграфическая база для выпуска документации в области вычислительной техники. Планировались филиалы в Калининграде, в Таганроге и т.д. То есть создавалась мощная сеть с хорошо поставленными задачами. И на нее государством был определен хороший ресурс. В течение пяти лет институт с этими задачами успешно справлялся.
Тогда у нас было около 1 тыс. сотрудников, мы осуществляли исследования по всем передовым направлениям в этой области. В нашей стране, в том числе и благодаря работам нашего коллектива, была создана полная линейка отечественной вычислительной техники. У СССР были собственные оригинальные компьютеры.
— Помню, тогда они еще назывались ЭВМ, электронно-вычислительные машины.
— Это был переходный период, использовали и тот и другой термины. У нас были собственные операционные системы, системы управления базами данных, графические и текстовые редакторы, компиляторы, драйверы. И, конечно, были специалисты, которые создавали программные продукты совсем не хуже тех, что были для IBM PC.

Сети земные и небесные

— А эксперты кто?
— Достаточно посмотреть, кто тогда интересовался нашими разработками. К нам в институт тогда приезжал молодой парень из Калифорнии по имени Стив Джобс. Наш коллега! Ему, как и любому американцу, интересно было попасть за железный занавес.
— К тому времени он уже был и довольно успешным бизнесменом. Если правильно помню, первые Apple они с Возняком сделали еще в конце 1970-х гг.
— Да, к тому времени на рынке персональных компьютеров уже прекрасно шел его Apple II. Он тогда вообще фонтанировал идеями. Позже, уже в середине 1990-х гг., к нам приезжал другой известный калифорниец, Билл Гейтс, дарил всем диски с Internet Explorer. Институт тогда был в тяжелом положении. Сначала, в 1988 г., умер академик Б.Н. Наумов, а вскоре и весь СССР рухнул. Уже к 1991 г. число сотрудников сократилось вчетверо, до 250 человек. Следующим директором стал И.А. Мизин, известный специалист в области сетей передачи данных, конструктор компьютерных сетей специального назначения. Он и принес новую тематику — сетевую. Системы, которые были спроектированы и изготовлены под его руководством, работают до сих пор.
— За 20 лет техника не устарела?
— Техника и элементная база уже, разумеется, другие, но алгоритмика, логика работы и архитектура остались прежними. Одна из таких систем специального, проще говоря, военного назначения практически полностью повторила семиуровневую архитектуру протоколов, которая потом была признана в мире за эталон. Новая тематика позволила институту сохраниться и вырасти. Знаковой точкой стал октябрь 1993 г.

— Разгон Верховного Совета?
— Это было 4 октября, а уже 6 октября мы приехали в Белый дом с указом президента Б.Н. Ельцина о восстановлении его информационно-коммуникационной инфраструктуры. Это было поручено нашему институту и Федеральному агентству
правительственной связи и информации. Мы с задачей справились. Приобретенный тогда опыт позволил нам и в дальнейшем решать такие крупные задачи.
— И много еще было задач подобного масштаба?
— Немало. В начале уже этого века российская банковская система столкнулась с интересной проблемой: она не могла войти в мировую спекулятивную систему, потому что не выполнялись ряд требований к актуальности информации. В финансовой сфере информация должна быть актуальной с точностью до 15 минут, а у нас это время растягивалось до 48 часов.
— Интернет тогда уже существовал...
— Банки не пользуются для передачи финансовой информации интернетом, для этого есть другие сети, гораздо более защищенные. Главная — Общество всемирных межбанковских финансовых каналов связи (SWIFT, Society for Worldwide
Interbank Financial Telecommunications). Но не в этом дело: такая медлительность системы была связана с полностью децентрализованной структурой Центрального банка: в его состав входили 78 самостоятельных рассчетно-кассовых центров по всей стране в разных часовых поясах. 12 систем операционного дня, не связанных между собой.
— У каждого часового пояса свой день?
— Дело не в часовых поясах, а в нескоординированности действий. Тем не менее в 2007 г. новая информационно-телекоммуникационная система заработала. Теперь вся платежная система страны базируется на трех коллективных центрах обработки информации: в Санкт-Петербурге, Нижнем Новгороде и Москве. Там находятся крупные вычислительные центры. Сейчас их называют дата-центрами, центрами обработки данных.
— А зачем надо было создавать три центра?
— По параметрам катастрофоустойчивости. Чтобы какая-либо природная или техногенная катастрофа не вывела из строя всю систему целиком, расстояние между такими центрами должно быть не менее 500 км. В принципе, по техническим показателям достаточно было и двух центров — в Санкт-Петербурге и Нижнем Новгороде. Третий, московский центр появился в большей степени по политическим соображениям. Система была создана в полном соответствии с международными стандартами катастрофоустойчивости — тогда это был передовой край науки. Удалось достичь актуальности значительно меньше 15 минут.
— Десять минут, пять?

— Информация стала доступна практически онлайн, задержки секундные.
— А если система зависла, сколько времени уходит на перезагрузку?
— За 20 лет существования не зафиксировано ни одного сбоя в ее работе по вине технических или программных средств.
— А как же множественность операционных дней?
— Эта проблема полностью решена. Сегодня действуют две системы: белорусская и казанская, но в ближайшее время останется одна. Тут главная проблема — переучить специалистов. Это одна из работ, которой занимался институт. Естественно, не один, в большой кооперации.
— Экономика, коммерция и финансы с математикой связаны кровно. А в других областях что-то подобное делали?
— Другая наша работа — единый банк данных по проблемам борьбы с терроризмом. Эта система агрегирует, собирает все возможные информационные ресурсы, чтобы выявить то, что может привести к теракту, помогает его предотвратить, а если не удалось — ликвидировать последствия. Для этого необходимо свести воедино информационную работу служб, которые этим должны заниматься. Это 15 ведомств: ФСБ, МВД, МЧС, Минобороны, Минтранс, ведомства, отвечающие за природные ресурсы, за энергетику и т.д. Нам удалось консолидировать все эти информационные потоки, не вмешиваясь в работу самих организаций. Мы получаем информацию в сыром виде, преобразуем, создаем единое информационное поле, и задачи действительно решаются. Эта система сдана заказчику весной 2008 г. И она до сих пор успешно работает.
— Много терактов удалось предотвратить?
— Не имею права раскрывать подробности, да они непосвященному и не интересны, но не без гордости скажу: система работает результативно. Мы и сейчас ведем ряд работ в интересах администрации президента РФ и силовых структур.
Если говорить про институт, они не только позволяют нам обеспечить достойные зарплаты сотрудникам, но и заставляют быть постоянно на переднем крае науки и технологий.
В конце 2000-х гг. стали появляться работы, которые показали: получение новых знаний требует новых методов. Связано это с успехами в компьютеростроении и появившейся возможностью промышленного производства сложнейших экспериментальных и наблюдательных установок.
— А раньше разве не было такой возможности?
— В современных масштабах — нет. Нынешние экспериментальные установки — это, например, мощнейшие ускорители, которые нам было не под силу сделать еще каких-то 10–15 лет назад. Наблюдательные установки — это телескопы, которые дают огромные объемы информации. Но для этого потребовалась новая методология получения научного знания.
— Неужели вы и к телескопам руку приложили?
— Телескоп для астронома стоит только в самом начале пути научного познания. Сейчас часто встречается термин data-intensive sciences — науки, основанные на интенсивном использовании данных. Уже в начале 2000-х гг. астрономы осознали,
что для них узким местом становится обработка массивов данных, полученных в результате наблюдений. Они решили эту проблему, создав инструмент под названием «виртуальная обсерватория». Это информационно-телекоммуникационная сеть,
в которой есть возможность удаленного получения данных с самых разных телескопов. Есть хранилище астрономических данных, и есть инструменты обработки этих данных с целью получения новых знаний. Наш институт сыграл значительную роль в разработке технологий европейских и российских виртуальных обсерваторий. Одна из наиболее известных европейских виртуальных обсерваторий AstroGrid содержит компоненты программного обеспечения, разработанные в нашем институте под управлением профессора Л.А. Калиниченко.

Больше данных, хороших и разных

— В последние семь-восемь лет парадигма data-intensive science охватила практически все науки. Сегодняшние значимые достижения в любой отрасли науки связаны именно с накоплением и нетривиальной переработкой этих данных. Большой адронный коллайдер — типичный пример. Несколько минут его работы дают пищу для долгой работы сотен коллективов по всему миру. Другой яркий пример — работы по расшифровке генома. Успех программы «Геном» в большой степени обусловлен привлечением математиков и вычислителей. Именно на успехах информационных технологий построены результаты, которые мы сегодня наблюдаем в этой отрасли. Несколько лет назад расшифровка генома занимала месяцы и стоила сотни тысяч долларов, а сегодня это два дня и тысяча долларов.
— По оценкам академика К.Г. Скрябина, в ближайшее время это будет стоить сто долларов и займет несколько минут.
— Два года назад президент США Барак Обама объявил по аналогии с программой «Геном» программу «Геном материала». Цель — получение в короткое время материала с заданными свойствами. У нас есть группа под руководством доцента МАИ
и завсектором ВЦ РАН К.К. Абгарян, дочери знаменитого советского кибернетика К.А. Абгаряна, которая занимается моделированием новых материалов с заданными свойствами.
— Сплавов?

— В первую очередь композитов. Это моделирование на уровне атомов, которое дает замечательные результаты, интересные и перспективные. Главный заказчик и потребитель сегодня — авиационная отрасль, для которой композиты — принципиальное направление. Мы хотим активно развивать этот вектор. В прошлом году с новым ректором МАИ академиком М.А. Погосяном создали на их базе кафедру материаловедения, которую возглавит К.К. Абгарян. Это сегодняшняя задача. В «Геноме материалов» будут большие достижения, особенно учитывая, какие деньги туда вкладывают.
Организация мирового научного сообщества по парадигме data-intensive science сегодня показывает высокие результаты. Думаю, такое положение дел будет сохраняться еще долгое время. Нам никак нельзя оставаться в стороне.
— Разумеется, в сфере информационных технологий без этого не обойтись.
— Я имею в виду не только информационные технологии, но и любые другие науки. Общаясь в той или иной степени практически со всеми учеными России, я вижу, что очень многие это понимают. Мы договаривались с директором Института цитологии и генетики СО РАН академиком Н.А. Колчановым о вовлечении наших специалистов в его работу по созданию единой системы биоколлекций России. Их сегодня около 200 — это очень большой массив данных, который, чтобы нормально работать, необходимо упорядочить. Сейчас главная задача для Н.А. Колчанова — возродить семенной фонд русского картофеля. И мы будем договариваться о конкретных работах в этой области.

Все в центр

— В 2014 г., когда были созданы мировые центры данных, стало понятно, что проблемы, связанные с развитием информационных технологий, командами в несколько сотен человек не решить. Нужны большие комплексные коллективы, но не междисциплинарные, а работающие в одном направлении — информатике. Широкие переговоры привели к договоренности трех основных институтов: нашего ИПИ РАН, Вычислительного центра им. А.А. Дородницына РАН и Института системного анализа РАН о создании Федерального исследовательского центра «Информатика и управление»
(ФИЦ ИУ) РАН.
— Почему именно эти институты?
— Мы работаем над одной тематикой. До 50% наших исследований имеют дословные совпадения в формулировках. Но это не значит, что мы решаем одни и те же задачи. Это, например, искусственный интеллект, нейрораспознавание, нереляционные системы управления базами данных. Конкретные научные задачи разные, а направление одно. Сотрудники наших институтов всегда взаимодействовали между собой, вплоть до перехода из института в институт. У нас одинаковый инструмент управления научными исследованиями, академический стиль работы — это хорошо. И с 2015 г. мы объединились. Сейчас нас 1,1 тыс. человек, среди которых 16 членов РАН. У нас пять новых диссертационных советов, восемь журналов, часть из которых выходят только на английском языке, 500 квалифицированных исследователей — докторов и кандидатов. Это мощный академический коллектив, главная задача которого — проведение фундаментальных исследований. Мы крупнейший в России коллектив в данной области, у нас хорошая наукометрия, в своей референтной группе мы на первом месте.
— Но таким большим коллективом не так просто управлять...
— Мы хотим построить организацию, которая состояла бы структурно из ядра ученых, проводящих базовые, фундаментальные научные исследования в области информационных технологий и работы с информацией и сети предметно-ориентированных лабораторий, которые занимаются проекцией этих фундаментальных новых знаний на предметную научную область. Эти коллективы пересекаются, но идея такая: на базе предметноориентированных лабораторий выращивать центры, о которых печется сейчас вся мировая наука. Их задачи — накапливать информацию, разрабатывать научный и технологический инструментарий работы с этой информацией. Научный — это математика, алгоритмы. Технологический — программное обеспечение, аппаратно-программные комплексы. Затем предоставлять этот инструмент всему научному сообществу для работы с такими данными.
— Ну и самим его использовать.
— Необходимо также готовить новых специалистов и вести коммерческую деятельность, чтобы зарабатывать деньги на нормальное существование и на развитие.
— Иными словами, вы структурировали само поле научных исследований.
— До объединения у нас было 86 научных тем, сейчас у нас десять основных научных направлений, которые возглавляют люди — лидеры в своей области.
— И что это за направления?
— Искусственный интеллект, моделирование технических и социально-экономических систем, информационная безопасность, методы обработки данных и т.д. Сейчас мы уже ставим интегральные, мейнстримные задачи.
— Искусственный интеллект — действительно актуальная научная область.
— Моделирование не менее актуально. Один из основных для последних десятилетий методов познания действительности — математическое моделирование объектов и процессов путем составления интегро-дифференциальных уравнений и решения их либо напрямую, либо с использованием электронно-вычислительных машин.
— Но все ли можно вывести в математическую модель?
— В последнее время стало понятно, что не все. Есть процессы и объекты, которые мы не можем описать никакими системами дифференциальных уравнений. Наиболее очевидный пример — мозг человека. Он не поддается описанию, а изучать его надо. Работа над математическим описанием подобного рода объектов и процессов привела к возникновению новой математики, нового научного направления, в первую очередь математического, который мы сейчас и называем «искусственный интеллект».
— У большинства людей этот термин прежде всего ассоциируется с роботами.
— Нет, искусственный интеллект и роботы — понятия в некотором роде связанные. Робот не обязательно должен быть наделен искусственным интеллектом, а искусственный интеллект вполне может существовать вне робота. В основе основ —
алгоритмика, методы, которые позволили математически оперировать такими понятиями, как «близость», «похожесть», «прецедент».
— То есть конкретный математический аппарат.
— Для этого потребовались серьезные научные достижения. Одно из основных — работы академика Ю.И. Журавлева, который доказал, что с алгоритмами можно работать так же, как с многочленами в произвольной степени. Это дало
возможность строить и строго описывать математические процессы из компонентов, которые строго не описаны, причем строить надежные описания.
Замечательные работы в этой области у коллектива, который возглавляет мой заместитель, профессор Г.С. Осипов. Это один из примеров передовой работы с извлечением знаний из неструктурированной информации: текста, звука и т.д. Это
выделение объектов, поиск аффиляций. Другой пример — идея лингвистического процессора, которая принадлежит нашему сотруднику И.П. Кузнецову. Все современные поисковики построены на реализации этого понятия. Очень плодотворно в направлении научных основ искусственного интеллекта работает коллектив профессора В.К. Финна. Его ДСМ-метод дает конкретные результаты, например в медицине. Именно такие разработки позволили коммерчески развиться многим компаниям. На крупнейшем ежегодном научном конгрессе по компьютерной лингвистике в Лас-Вегасе секцию машинного перевода возглавляет заведующая лабораторией компьютерной лингвистики и когнитивных технологий обработки текстов нашего института Е.Б. Козеренко. Крупнейшее объединение специалистов в области информатики ACM (Association for Computing Machinery) включает миллионы людей. АСМ проводит десятки конференций, издает сотни журналов. Они работают по принципу групп по интересам. Группу, изучающую системы управления базами данных, возглавляет еще один наш сотрудник, заведующий лабораторией композиционных методов проектирования информационных систем Л.А. Калиниченко.
— Значит, говоря о людях-лидерах, вы имели в виду лидеров даже не российского, а мирового масштаба?
— Конечно. Новая математика привела к возможности получения абсолютно новых и очень интересных результатов. Создание и развитие ФИЦ ИУ РАН нацелено именно на решение таких задач.
— А что уже сделано?
— В рамках центра создан Институт образовательной информатики. Его предметная область — образование, в первую очередь современная школа. Это первый наш шаг. Он обусловлен не только научными, но и социальными аспектами. Возглавляет его академик-математик А.Л. Семенов, до недавнего времени возглавлявший Московский педагогический государственный университет. Он активно взялся за работу, и он тоже величина номер один в своей области. Затем мы организовали центр медицинской информатики. Возглавляет его академик Г.И. Назаренко, тоже академик-математик и академик-медик, создавший медицинский центр ЦБ РФ и долгое время им руководивший. Создан центр технологий цифровой экономики. В планах — наладить сотрудничество с генетиками, материаловедами, геофизиками. Список открыт.
Уже сформулирована и выполняется программа создания предметно-ориентированных лабораторий, о которых я говорил. Считаю, что это единственный правильный путь, по которому сегодня может идти большая наука. В первую очередь мы должны консолидировать усилия по подготовке специалистов в области информационных технологий. Здесь есть проблема: не только средняя школа, но и высшая школа готовит в основном компиляторов — людей, которые умеют складывать кубики, а не сами эти кубики изготавливать. Мы постоянно обсуждаем этот вопрос с ректором МГУ академиком В.А. Садовничим. Думаю, рано или поздно здесь будут приняты правильные решения.
— Но это все пока чисто организационные решения и достижения. А что с практикой?
— В нашем центре много интересной практической работы. Вообще, мы пока в большой степени ориентированы на выполнение работ в интересах спецструктур и обороны страны. Есть задания, которые выполняются по прямому распоряжению президента России. Я возглавляю секцию автоматизированных систем управления и несколько рабочих групп в научно-техническом совете Военно-промышленной комиссии РФ. Мы каждый месяц проводим научно-технические мероприятия, в которых принимают участие представители всех организаций, работающих в сфере автоматизации и информатизации, практически со всей страны. Это не только научные учреждения, но и производственные предприятия, потому что все должно переходить в конкретные изделия. Именно формат федерального исследовательского центра позволяет правильно и эффективно организовать работу. Поэтому я считаю, что наш центр представляет собой успешный пример того, как нужно реструктурировать сеть академических институтов.
— Нужно выделять актуальную, важную, долгоиграющую научную проблему и подтягивать к решению этой проблемы профессионалов в данной области.
— Да. При этом совершенно необязательно объединять физиков и лириков, хотя иногда и это тоже нужно. Самое главное — должно быть общее занятие, общая или схожая задача, цель, вектор. Когда объединяются институты одной направленности,
происходит усиление и формирование коллективов, которые способны поставить и решить крупные задачи от начала до конца.