Английский

Загрузка...

Что такое генерация с расширенным поиском или RAG?

By Aamir Sheikh
20 апреля 2024 г.

3 минуты чтения

Поисково-дополненная генерация

Содержание

1. Понимание генерации с расширенным поиском или RAG

2. Преимущества РАГ

Поделиться ссылкой:

TL;DR

Генерация с расширенным поиском — это процесс извлечения фактов из внешних источников.
Он используется для создания LLM на основе текущих и достоверных баз знаний и предоставляет пользователям доступ для перекрестной проверки.
RAG помогает снизить затраты на обучение моделей ИИ, поскольку снижает потребность в непрерывном обучении.

Точность и надежность генеративных моделей ИИ можно повысить за счет фактов, полученных из внешних источников, а метод, используемый для их получения, называется генерацией с расширенным поиском (RAG).

Для простоты предположим, что хорошая модель большого языка (LLM) может отвечать на широкий спектр человеческих запросов. Но для достоверных ответов в них должны быть процитированы какие-то источники, а для этого нужно провести некоторое исследование, поэтому модели понадобится помощник. Этот вспомогательный процесс для простоты называется генерацией с расширенным поиском или RAG.

Понимание генерации с расширенным поиском или RAG

Чтобы лучше понять RAG, он заполняет пробелы, которые уже существуют в работе LLM. Качество или сила LLM измеряется количеством имеющихся у него параметров. Параметры — это, по сути, общие закономерности того, как мы, люди, используем слова для составления предложений. LLM могут не соответствовать ответам, которые они дают.

Иногда они предоставляют именно ту информацию, которая нужна пользователю, а иногда просто выдают случайные факты и цифры из наборов данных, включенных в их обучение. Если иногда студенты LLM дают расплывчатые ответы, как будто они не знают, что говорят, то это потому, что они действительно понятия не имеют, о чем говорят. Как мы говорили о параметрах строкой выше, LLM могут связывать слова статистически, но они не знают их значений.

Интеграция RAG в чат-системы на основе LLM имеет два основных преимущества: она гарантирует, что модель может получить доступ к текущим и надежным фактам, а также гарантирует, что пользователи могут проверить достоверность ее утверждений, поскольку у них есть доступ к источникам данных. модель.

Директор по языковым технологиям IBM Research Луис Ластрас сказал:

«Вы хотите сопоставить ответы модели с исходным содержанием, чтобы увидеть, на чем она основывает свой ответ».
Источник: IBM .

Есть и другие преимущества, поскольку это снижает вероятность галлюцинаций и утечки данных, поскольку у него есть возможность основывать свои знания на внешних источниках, поэтому ему не нужно полагаться исключительно на данные, на которых он обучался. RAG также снижает финансовые и вычислительные затраты на использование чат-ботов, поскольку ему меньше нужно обучаться работе с новыми данными.

Преимущества РАГ

Традиционно в моделях цифрового разговора использовался подход ручного диалога. Они установили свое понимание намерений пользователя, затем извлекли информацию на этой основе и предоставили ответы в общем сценарии, уже defi программистами. Эта система была способна отвечать на простые и понятные вопросы. Однако система имела ограничения.

Предоставление ответов на каждый запрос, который потенциально мог запросить клиент, занимало много времени: если пользователь пропустил шаг, чат-бот не имел возможности справиться с ситуацией и импровизировать. Однако современные технологии позволили чат-ботам предоставлять персонализированные ответы пользователям без необходимости писать новые сценарии людьми, и RAG делает еще один шаг вперед, сохраняя модель свежего контента и уменьшая потребность в обучении. Как сказал Ластрас,

«Думайте о модели как о чрезмерно нетерпеливом младшем сотруднике, который выпаливает ответ, прежде чем проверить факты. Опыт учит нас останавливаться и говорить, когда мы чего-то не знаем. Но LLM необходимо специально обучать распознавать вопросы, на которые они не могут ответить».
Источник: IBM.

Как мы знаем, вопросы пользователей не всегда однозначны, они могут быть сложными, расплывчатыми и многословными или требуют информации, которой нет в модели или которую невозможно легко проанализировать. В таких условиях у ЛЛМ могут возникнуть галлюцинации. Точная настройка может предотвратить такие случаи, а LLM можно научить останавливаться, когда они сталкиваются с такой ситуацией. Но чтобы распознать их, ему нужно будет дать тысячи примеров таких вопросов.

RAG — лучшая доступная в настоящее время модель, позволяющая основывать программы LLM на новейших и наиболее подтверждаемых данных, а также снижать объем обучения. RAG также развивается со временем и все еще нуждается в дополнительных исследованиях для устранения недостатков.

Источник вдохновения можно увидеть здесь .

Отказ от ответственности: предоставленная информация не является торговой консультацией. Cryptopolitan.com не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы tron рекомендуем провести dent исследование и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какое-либо инвестиционное решение.

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалюты, получайте ежедневные обновления на свой почтовый ящик.

Связанные новости

2 минуты чтения

Как технологические инновации способствуют устойчивому развитию телекоммуникационной отрасли

#Новаторы

3 минуты чтения

Генеративный искусственный интеллект меняет бизнес-ландшафт Южной Африки

2 минуты чтения

Worldcoin стремится к технологическому партнерству, несмотря на регуляторную борьбу

#Объяснение

2 минуты чтения

Reddit может подать в суд на компании, занимающиеся искусственным интеллектом, если деловые переговоры провалятся