История развития нейросетевых технологий восходит к 1943 г., когда один из основателей кибернетики Уоррен Макколак выпустил работу, в которой были представлены основные принципы функционирования искусственного интеллекта. Неизвестно, полагал ли Макколак, что в следующем веке его последователи попробуют вытеснить из литературы «человека печатающего» и программы искусственного интеллекта станут создавать журналистские тексты. Тем не менее, в XX веке нейросети еще не использовались для создания текстов, и языковые программы, например, первые автоматические переводчики, работали только на основе внесенных примеров и статистики.
Определенный прорыв произошел в 2010 г., когда в Токио был представлен первый андроид-журналист. Интересно, что это был не копирайтер, а репортер. У робота были камера и датчики, позволяющие анализировать все происходящее вокруг, чтобы затем создавать отчеты. Репортаж — один из самых сложных и дорогих в журналистике жанров, поэтому японское изобретение выглядело интересно, но футуристично. Однако оно привело к более или менее успешным попыткам создавать на основе нейросетей тексты в жанрах попроще.
Самый простой и лаконичный жанр СМИ — новостная заметка (обычно около 2000 символов) не требует особого творчества, и потому, в отличие от репортажа, показался ученым подходящим, чтобы поручить его роботам. В 2010 г. американская компания Narrative Science выпустила собственную программу для написания текстов на основе работы нейросети.
Narrative Science показала способность структурировать текст и оперировать стилистическими приемами. В 2015 г. к программе проявил интересе журнал Forbes. На сайте издания до сих пор висят сорок семь коротких новостных заметок, автором которых указана Narrative Science. Последняя вышла 12 октября 2015 г. Руководство издания не стало целиком вверять журнал роботам, довольствовавшись полугодовым экспериментом.
Другая страница в истории искусственных языковых интеллектов связана с изданием Los Angeles Times. В 2013 г. был разработан алгоритм Quakebot, призванный оперативно выпускать сообщения о землетрясениях на основе отчетов государственных органов. Quakebot создавал сообщения по информации с сайта Геологической Службы США всего за три минуты — время, за которое живой журналист едва бы успел обработать информацию.
Однако в 2017 г. алгоритм совершил непростительную для качественного издания ошибку. На сайте Геологической службы был опубликован исторический текст о землетрясении 1925 г., но сотрудник, опечатавшись, поставил дату 2025. Quakebot тут же опубликовал сообщение о надвигающемся катаклизме. Новость была удалена, и редакция принесла извинения, но данный случай наглядно показал слабые места роботизированной журналистики. Нейросеть не способна распознать фейк, и может в считанные минуты распространить его на беду доверчивой аудитории.
В 2015 г. компания Automated Insights запустили программу Wordsmith (Кузница слов) для автоматического написания новостных заметок. Программой стало активно пользоваться старейшее информационное агентство Associated Press для формирования заметок на тему финансов. В агентстве смогли добиться от агрегатора способности писать без ошибок и относительно живым языком, но он все равно требовал постоянного контроля редактора и программиста.
На возможности нейросетевых журналистов-новостников есть разные взгляды, подкрепленные своими аргументами. С одной стороны, роботизированная журналистка ненадежна, ее тексты несовместимы с юмором и могут упустить важную деталь, доступную только живому журналисту. С другой, на стороне роботов скорость: среднее время написания новости живым журналистом — до 30 мин. Нейросеть напишет ее в десять раз быстрее. К тому же такой автор не нуждается в окладе, отпусках и больничных. Новостная заметка — это жанр, который не требует особого творчества, поэтому опытный редактор СМИ Галина Тимченко, считает, что 90% черновой работы с текстом можно отдать машине, хотя остальные 10%, самую важную часть, все равно будет выполнять редактор.
Впрочем, последние годы показали, что нейросетям доступно написание не только новостей, но и текстов других жанров. В сентябре 2020 компания OpenAi презентовала алгоритм GPT-3 (Generative Pre-trained Transformer 3) для «решения любых задача на английском языке». Русский язык имеет более сложную структуру, но уже в 2021 на платформе Сбера вышла русская версия программы — RuGPT-3. Читатель может сам протестировать алгоритм, вставив любую фразу, чтобы робот ее продолжил. Предположим, мы хотим, чтобы нейросеть написала приключенческую повесть и вводим фразу «Я ринулся вперед». В ответ мы получаем остросюжетную сцену с эмоциональным диалогом. Правда, логическая связь предложений при этом весьма фрагментарная, да и литературная ценность самого текста сомнительная.
Последний интересный проект творческой нейросети представили в январе 2022 г. на платформе «Тинькофф Банк». Это алгоритм для написания стихов «Ai да Пушкин». Он создает рифмованные произведения, стилизованные под творчество русского поэта. Едва ли подобные стихотворения когда-либо будут считаться классикой, однако роботизированный поэт соблюдает рифму, иногда и размер, в его стихах даже есть определенный смысл (очевидно, потому что они довольно короткие, иначе бы смысл сразу нарушился). На любую введенную фразу он ответит четверостишием, хотя есть слова, введя которые пользователь не получит произведения электронной поэзии. Нет, не потому что нейросеть сгорит, подобно мозгу роботов, не справлявшихся с детской загадкой в советском научно-фантастическом фильме. Разработчик просто напоминает, что есть вещи, доступные во всей полноте только с творческим усилием живого человека. Например, если ввести в «Ai да Пушкин» слово «Россия» или «русский», появится ответ, что об этом лучше почитать настоящие стихи Александра Сергеевича.
Таким образом, нейросеть может способствовать оперативному созданию новостного контента в СМИ, но пока едва ли может составить конкуренцию живому журналисту-новостнику и нуждается в контроле редакторов и программистов. Что касается поэзии и вообще более сложных, чем новостная заметка жанров, то все существующие сегодня алгоритмы годятся только для того, что восхищаться, до чего дошел прогресс. Хотя, возможно, значительное изобретение, может начинаться и с подобных объектов сущей забавы.
Автор Семен Лопухов
Фото: everythingpossible / Фотобанк ru.123rf.com