Мельников Е.В., ведущий инженер-программист Гомельской ОНТБ
Возможности нейросетей для библиотек
Развитие и внедрение в нашу жизнь искусственного интеллекта (нейросетей) неизбежно. Каждый человек, независимо от сферы его деятельности, будет использовать искусственный интеллект прямо или косвенно. Эти мощные инструменты для обработки данных и анализа информации находят применение в различных областях – от медицины до финансов. В библиотечной сфере их роль также может стать значительной.
Что такое искусственный интеллект сегодня? Если говорить коротко, это программа, под капотом которой находятся сложные математические формулы для генерации текста, изображений или распознавания образов. Эта программа пропускает через себя огромные объемы данных, создавая тем самым некую «карту» взаимосвязей между данными. Чем больше данных обрабатывается, тем точнее «карта» и тем лучше нейросеть формирует ответы.
Термины «искусственный интеллект» и «нейросеть» часто используют как синонимы. В данной статье эти термины также обозначают одно и то же.
Давайте рассмотрим, как искусственный интеллект может помочь сотрудникам библиотеки.
Возможности искусственного интеллекта
Создание контента для социальных сетей. Нейросети могут помочь придумать креативные идеи, заголовки или даже написать полноценный текст для публикации. Кроме этого, они могут сгенерировать иллюстрацию к тексту. При этом можно не бояться нарушения авторских прав, т.к. контент сгенерирован нейросетью и является уникальным.
Работа с внутренними документами. Если вам нужно написать какое-нибудь важное электронное письмо, вы можете просто попросить искусственный интеллект сделать это. Вам нужно будет описать основную тему письма, что вы хотите выразить и в какой манере. После того, как нейросеть сгенерирует письмо, возможно, вам придется внести некоторые правки, но это значительно легче, чем писать самостоятельно с нуля. Эту технологию можно использовать и при подготовке отчетов, докладов, планов презентаций и т.д.
Платформа chatGPT* от компании OpenAI предоставляет возможность подключать ее искусственный интеллект к вашим данным, чтобы генерировать ответы, опираясь на них. Например, вы можете загрузить книгу и задавать вопросы по ней, а нейросеть ответит на них.
*На данный момент работа с chatGPT не доступна в Беларуси, но конкурентные решения сейчас активно развиваются. Например, такие российские компании, как «Яндекс» и «Сбер» очень активно работают над развитием собственных моделей искусственного интеллекта.
Суммаризация текстов. Когда вы ищете информацию в Интернете, нейросети помогают суммировать длинные статьи или новостные материалы. Например, они могут не только выделять ключевые факты или основные идеи из большого объема текста, но и способны определять его настроение и тональность. Это может помочь, к примеру, когда у вас есть большой поток отзывов и вы хотите знать, какие из них негативные, чтобы среагировать на них.
Классификация и индексация книг. Искусственный интеллект может анализировать содержание книг и автоматически присваивать им тематические метки. Например, он может определить жанр, автора, ключевые слова и другие характеристики. Также нейросеть может автоматически классифицировать книги по разным параметрам: разделить книги на художественные и научно-популярные, по тематике или по возрастным ограничениям. Искусственный интеллект может решать даже сложные задачи, такие как сортировка материалов по стилистике или году выпуска.
Оцифровка книг. С помощью искусственного интеллекта можно оцифровывать не только сканы книг, но даже рукописный текст. Например, такой работой занимается «Яндекс»: в проекте «Поиск по архивам» уже оцифровано более 10 млн исторических документов.
Общение с пользователями. Автоответы на вопросы пользователей существуют давно, но раньше они работали через отправку уже заранее заготовленного текста в ответ на какое-то ключевое слово в сообщении пользователя. Искусственный интеллект же может для каждого пользователя создавать персонализированный ответ и более точно отвечать на вопрос.
Риски и ограничения
Цена. Обучение нейросетей и выполнение ими каких-то задач требует больших вычислительных мощностей. Поэтому компании, которые владеют продвинутыми моделями искусственного интеллекта, берут плату за использование их систем. Обычно эта плата состоит из двух частей: ежемесячная подписка + оплата за выполнение конкретной задачи. Вторая часть зависит от того, какая именно задача и какой объем информации нужно обработать.
Конечно, есть бесплатные решения, такие как Copilot от Microsoft или YandexGPT, но они предоставляются только для личного использования и через определенный веб-интерфейс от компании.
Непредсказуемость. В таких задачах, как общение с пользователями, мы не можем заранее узнать, что ответит нейросеть. В каких-то случаях она может дать некорректную информацию или вообще ответить неадекватно. Сама она не признается, что у нее есть ограничения. Даже если у нее не хватает данных для ответа, она будет пытаться придумать правдоподобный ответ. Поэтому за ее ответами надо следить. Этот эффект можно минимизировать при помощи детальных инструкций для нейросети, но 100% гарантий они все равно не дают.
Безопасность. Компании, которые владеют искусственным интеллектом, предупреждают, что те данные, которые вы используете для постановки задачи нейросети, передаются на их серверы, чтобы пополнять общую базу и в дальнейшем делать модель «умнее». Поэтому надо быть осторожным и не передавать конфиденциальных данных. Неприятная ситуация произошла с компанией Samsung, в которой инженеры использовали нейросеть для своей работы. Они вставляли программный код в ChatGPT и просили искусственный интеллект найти ошибку. Они не знали, что эти данные становятся частью внутренней базы ChatGPT. В результате нейросеть потом использовала эти данные для ответов другим пользователям и раскрывала закрытую информацию.
Совет: как получить лучший ответ от нейросети
Запрос, который вы составляете для нейросети, называется промт. Чтобы нейросеть давала более качественный и уникальный ответ, промт должен быть насыщен деталями.
Пример плохого промта: «напиши текст про день города».
Пример хорошего промта: «напиши текст для социальных сетей о том, что в городе Гомеле прошел праздник – День города. Опиши мероприятия, которые проходили в городе, – ярмарки, выставки, мастер-классы, музыкальные выступления – и какие эмоции это вызвало у горожан. В конце текста сделай призыв к действию посетить библиотеку для тех, кто хочет глубже узнать историю города».
По второму промту нейросеть сможет сгенерировать более качественный текст.
Заключение
Искусственный интеллект – это не просто технологический тренд, но и мощный инструмент для современных библиотек. Сейчас этот инструмент только начинает входить в массовое применение. Пока что искусственный интеллект имеет множество технических ограничений и не может удовлетворить все наши требования. Однако скорость его развития сильно выросла за последние годы, и уже через несколько лет ситуация может кардинально измениться. Необходимо «держать руку на пульсе» и следить за прогрессом в этой сфере, а также искать способы применения искусственного интеллекта.