Что такое технология RAG и как она «Запрещает» нейросетям фантазировать

Дата публикации: 1 ноября 2024

Восторг от нейросетей понемногу проходит, а их использование становится обыденным. Практически каждый день мы так или иначе обращаемся к искусственному интеллекту, чтобы он нарисовал картинку, придумал текст для поздравления коллеги, подготовил слоган для рекламы и по многим другим поводам.

Однако нейросети обладают массой недостатков, которые сильно ограничивают спектр их применения. Из наиболее значимых разработчики выделяют так называемые «галлюцинации», когда система самостоятельно выдумывает какие-либо факты и таким образом вводит пользователя в заблуждение.

С подобной проблемой помогает справиться технология Retrieval Augmented Generation (RAG). Сегодня мы подробно разберем, почему искусственный интеллект любит фантазировать, и как разработчики заставляют его говорить только правду.

Причины возникновения «Галлюцинаций» искусственного интеллекта

Современные языковые модели, например ChatGPT, способны генерировать ответы практически на любой вопрос, но при этом часто допускают фактологические ошибки или попросту выдумывают. Например, если спросить ChatGPT: «Какая сейчас погода?», она способна с легкостью ответить, что за окном жара, хотя на самом деле идет мокрый снег. Это связано с тем, что нейросети нужно обязательно дать ответ, но в её базе знаний попросту нет этой информации, потому что её туда не записали.

Если упрощать, то в подобных ситуациях ChatGPT можно сравнить с двоечником, который не сделал домашнее задание, но ему очень нужно ответить на вопрос строгого учителя. При этом сказать, что он не знает, он тоже не может.

Описанная проблема в течение многих лет мешала использовать нейросети как полноценные базы данных или аналоги поисковых систем. Однако с появлением технологии RAG всё изменилось.

Что такое RAG?

Retrieval Augmented Generation (RAG) — это технология, которая позволяет добавлять к вопросу пользователей набор данных из определенных источников, основываясь на которых система сможет дать более точный и релевантный ответ.

По большому счёту, RAG выступает в качестве соседа по парте, который подсказывает правильный ответ тому самому двоечнику.

Как работает технология RAG?

Технология RAG состоит из трёх основных элементов, которые заложены в её названии — Retrieval Augmented Generation.

Этот элемент отвечает за поиск информации, релевантной запросу пользователя к нейросети.

Поиск может выполняться по любой базе данных, например, по справочнику технической поддержки с часто задаваемыми клиентами вопросами.

Retrieval (Поиск)

Дополнение запроса пользователя к нейросети найденной информацией из связанной базы данных.

Augmented (Дополнение)

Генерация итогового запроса к нейросети с дополнительными данными, которые могут содержать ответ на вопрос пользователя.

После того как каждый из элементов выполнил свою функцию, формируется запрос к искусственному интеллекту, который в ряде случаев выглядит следующим образом:

Пользователь задал вопрос: “текст вопроса”. Вот информация, на основе которой нужно сформировать ответ: “информация из базы данных”. Ответь на вопрос, основываясь только на приведенной информации. Если в предложенных данных нет ответа на поставленный вопрос, то ответь, что не знаешь.

Таким образом, система лишает нейросеть возможности самостоятельно выдумывать ответ на вопрос. И даже если в приложенных к запросу данных нет ответа, то нейросеть скажет об этом прямо, а не станет «Галлюцинировать».

Generation (Генерация)

Пример использования технологии RAG в бизнесе

Наша компания в течение многих лет ведет свою собственную базу знаний, в которой сконцентрирован огромный объем информации практически за всю историю существования IT-Solution. Инструкции, справочники, обучающие материалы, прайс-листы — все это доступно в едином хранилище, которое построено на базе приложения «База знаний и тестирование для Битрикс24».

На сегодняшний день объем собранных данных настолько большой, что стандартный поиск в ней стал отнимать слишком много времени. Это замедлило многие рабочие процессы. Чтобы решить такую сложную и нетривиальную задачу, мы создали собственного GPT-бота, для корректной работы которого, в том числе, используется технология RAG.

Теперь, чтобы найти необходимые материалы в базе знаний, сотрудникам достаточно обратиться к боту и задать свой вопрос. Система сама находит подходящие материалы, дополняет ими вопрос пользователя и только после этого передает запрос искусственному интеллекту. По итогу сотрудник получает сжатый ответ и список материалов, в которых может содержаться информация по его вопросу.

Важной особенностью нашего решения является то, что система учитывает настройки доступа к тем или иным материалам в базе знаний. Сотрудники не смогут получить информацию из конфиденциальных материалов, обратившись к GPT-боту, если у них нет соответствующих прав.

Фактически, внедрив данное решение, мы создали автоматизированную техническую поддержку для сотрудников компании. Однако она может применяться и для ответов на вопросы клиентов.

Более подробно о данном решении вы можете ознакомиться в нашем кейсе или на странице приложения «База Знаний и тестирование».

Подведем итог

Технология Retrieval Augmented Generation — это инструмент, который сильно расширил спектр задач, которые может выполнять современный искусственный интеллект. Именно благодаря ей, обращаясь к Яндекс Алисе или другой аналогичной нейросети, вы получаете достоверную информацию, а не фантазии искусственного интеллекта.

Упростите ведение бизнеса для себя и своих сотрудников

Отправьте заявку, мы свяжемся
с вами в ближайшее время и обсудим детали вашего вопроса.

Смотрите также