Your bank is using your money. You’re getting the scraps.WATCH FREE

Что такое генерация с расширенным извлечением информации (Retrieval-Augmented Generation, RAG)?

В этом посте:

  • Генерация с использованием методов поиска и дополнения — это процесс извлечения фактов из внешних источников.
  • Он используется для создания программ магистратуры на основе существующих и достоверных баз знаний и предоставляет пользователям доступ для перекрестной проверки.
  • Метод RAG помогает снизить затраты на обучение моделей ИИ, поскольку уменьшает необходимость в непрерывном обучении.

Точность и надежность моделей генеративного ИИ можно повысить за счет данных, полученных из внешних источников, а используемый для их получения метод называется генерацией с расширением поиска (Retrieval-Augmented Generation, RAG).

Для простоты понимания предположим, что хорошая большая языковая модель (БЯМ) может отвечать на широкий спектр запросов человека. Но для получения достоверных ответов необходимо наличие ссылок на источники, а для этого модели требуется провести определенные исследования, поэтому ей понадобится помощник. Этот вспомогательный процесс для простоты называется генерацией с расширением поиска, или RAG.

Понимание процесса генерации с расширенным извлечением информации (Retrieval-Augmented Generation, RAG)

Для более глубокого понимания RAG, он заполняет пробелы, уже существующие в работах LLM. Качество или эффективность LLM измеряется количеством параметров, которые он имеет. Параметры — это, по сути, общие закономерности того, как мы, люди, используем слова для построения предложений. LLM могут давать противоречивые ответы. 

Иногда они предоставляют пользователю именно ту информацию, которая ему нужна, а иногда просто выдают случайные факты и цифры из наборов данных, включенных в их обучение. Если иногда LLM дают расплывчатые ответы, как будто они не понимают, что говорят, это потому, что они действительно не имеют представления о том, что говорят. Как мы уже говорили о параметрах выше, LLM могут статистически связывать слова, но они не знают их значений.

См. также:  Выход Fairgame$ предположительно отложен из-за ухода основательницы Haven Studios Джейд Рэймонд.

Интеграция RAG в чат-системы на основе LLM имеет два основных преимущества: она гарантирует, что модель имеет доступ к актуальным и достоверным фактам, а также обеспечивает пользователям возможность проверить достоверность ее утверждений, поскольку они имеют доступ к источникам модели.

Директор подразделения языковых технологий в исследовательском центре IBM, Луис Ластрас, заявил:

«Вам нужно сопоставить ответы модели с исходным контентом, чтобы понять, на чём основан их ответ»

Источник: IBM .

Есть и другие преимущества, например, снижается вероятность галлюцинаций и утечки данных, поскольку чат-боты могут основывать свои знания на внешних источниках, не полагаясь исключительно на данные, на которых они обучались. RAG также снижает финансовые и вычислительные затраты на работу чат-ботов, поскольку им требуется меньше обучения на новых данных.

Преимущества RAG

Традиционно модели цифрового диалога использовали ручной подход. Они определяли намерения пользователя, затем получали необходимую информацию и предоставляли ответы в общем сценарии, уже defiпрограммистами. Эта система была способна отвечать на простые, понятные вопросы. Однако у системы были ограничения.

Раньше предоставление ответов на все возможные вопросы клиентов отнимало много времени, и если пользователь пропускал какой-либо шаг, чат-бот не мог справиться с ситуацией и импровизировать. Однако современные технологии позволяют чат-ботам предоставлять персонализированные ответы пользователям без необходимости написания новых сценариев людьми, а RAG идет еще дальше, сохраняя модель работы с новым контентом и сокращая потребность в обучении. Как сказал Ластрас:

«Представьте себе ситуацию как чрезмерно рьяного младшего сотрудника, который выпаливает ответ, не проверив факты. Опыт учит нас останавливаться и говорить, когда мы чего-то не знаем. Но магистров права необходимо специально обучать распознавать вопросы, на которые они не могут ответить»

Источник: IBM.

Как известно, вопросы пользователей не всегда просты, они могут быть сложными, расплывчатыми и многословными, или требовать информации, которой модель не располагает или которую не может легко проанализировать. В таких условиях модели на основе линейных алгоритмов могут давать галлюцинации. Тонкая настройка может предотвратить подобные случаи, и модели на основе линейных алгоритмов можно обучить останавливаться, когда они сталкиваются с такой ситуацией. Но для распознавания таких вопросов потребуется предоставить им тысячи примеров.

См. также:  Meta выпускает инструменты для работы с ИИ, в том числе инструмент для проверки точности других моделей ИИ.

RAG — лучшая из доступных на данный момент моделей для построения линейных моделей на основе самых последних и подтвержденных данных, а также для сокращения времени обучения. RAG также развивается со временем и требует дальнейших исследований для устранения недостатков.

Вы всё ещё позволяете банку оставлять себе лучшие результаты? Посмотрите наше бесплатное видео о том, как стать собственным банком .

Поделиться ссылкой:

Предупреждение:  Предоставленная информация не является торговой рекомендацией. Cryptopolitan не несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мы tron рекомендуем провести независимое dent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Загрузка статей, выбранных редактором...

- Криптовалютная рассылка, которая поможет вам быть в курсе событий -

Рынки быстро меняются.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременные, точные и актуальные аналитические материалы о криптовалютах прямо на свою электронную почту.

Присоединяйтесь прямо сейчас и
ничего не пропустите.

Заходите. Получайте достоверную информацию.
Опережайте события.

Подпишитесь на CryptoPolitan