ПОСЛЕДНИЕ НОВОСТИ

жить Почему сегодня наблюдается обвал индексов S&P 500, Nasdaq и Dow Jones?

9 июня 2026 г. — Прямые трансляции
Компания BlackRock Ларри Финка стремится приобрести долю в SpaceX за 5 миллиардов долларов перед рекордным IPO завтра

8 минут назад Бизнес
Компания SpaceX установила цену IPO на уровне 135 долларов за акцию, прогнозируя рекордные 75 миллиардов долларов на дебютном размещении

17 минут назад Технологии
Coinbase открывает торговые счета для ИИ-агентов с помощью нового продукта для торговли на основе ИИ

47 минут назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

При обучении на данных, сгенерированных самим ИИ, модели искусственного интеллекта выдают «бессмыслицу»

Джеффри

Гого

2 минуты чтения, 26 июля 2024 г.

Исследование показало, что моделям искусственного интеллекта, обученным с использованием данных, сгенерированных самим ИИ, не хватает содержательности и нюансов.
Полученные результаты ставят перед разработчиками ИИ новую задачу.
Исследователи призывают к осторожности при использовании данных для обучения ИИ.

большие языковые модели (LLM), обученные на предыдущих версиях сгенерированного ИИ материала, выдают результаты, лишенные содержания и нюансов. Эти выводы представляют собой новую проблему для разработчиков ИИ, которые полагаются на ограниченные наборы данных, созданных людьми, для формирования контента.

Исследователи в области искусственного интеллекта из Кембриджского и Оксфордского университетов в Великобритании попытались написать подсказки, используя набор данных, состоящий исключительно из контента, сгенерированного ИИ. Результат оказался неудовлетворительным, поскольку ответы получились непонятными.

Искусственному интеллекту по-прежнему нужны люди, чтобы понимать смысл его работы

Один из авторов статьи, Жакар Шумайлов из Кембриджского университета, заявил о необходимости контроля качества данных, используемых в LLM-системах — технологии, лежащей в основе генеративных чат-ботов на основе искусственного интеллекта, таких как ChatGPT и Google Gemini. Шумайлов сказал:

«Главный посыл в том, что мы должны быть очень осторожны с тем, что попадает в наши обучающие данные. [В противном случае] всё всегда, с доказанной вероятностью, пойдёт не так».

Это явление известно как «коллапс модели», пояснил Шумайлов. Доказано, что оно затрагивает все виды моделей искусственного интеллекта, включая те, которые специализируются на генерации изображений с использованием текстовых подсказок.

Согласно исследованию ,повторные текстовые подсказки, сгенерированные искусственным интеллектом на одной из моделей, в итоге приводили к бессмысленному набору символов. Например, исследователи обнаружили, что одна система, протестированная с текстом о средневековых церковных башнях Великобритании, после всего девяти поколений выдала повторяющийся список зайцев.

Комментируя полученные результаты, специалист по информатике из Калифорнийского университета Хани Фарид сравнил обвал данных с проблемами, характерными для инбридинга у животных.

«Если вид вступает в инбридинг со своим собственным потомством и не диверсифицирует свой генофонд, это может привести к вымиранию вида», — сказал Фарид.

Когда исследователи внедрили в данные ИИ данные, сгенерированные людьми, коллапс происходил медленнее, чем когда система работала исключительно на контенте, сгенерированном ИИ.

При обучении на данных, сгенерированных ИИ, модели искусственного интеллекта выдают бессмысленный набор символов.

Исследователи: Искусственный интеллект может усугубить предвзятое отношение к группам меньшинств

Языковые модели работают, устанавливая связи между токенами — словами или частями слов — в огромных массивах текста, часто собранных из интернета. Они генерируют текст, выдавая статистически наиболее вероятное следующее слово на основе этих изученных закономерностей.

Исследование, опубликованное в журнале Nature 24 июля, показало, что информация, упомянутая несколько раз в наборах данных, скорее всего, не будет повторяться. Исследователи опасаются, что это может негативно повлиять на и без того маргинализированные группы меньшинств.

Чтобы предотвратить сбой модели в реальных условиях, в исследовании предлагалось наносить водяные знаки на контент, созданный ИИ, и на контент, созданный человеком. Однако это также может бытьmatic из-за отсутствия координации между конкурирующими компаниями, занимающимися ИИ, говорится в исследовании.

Результаты исследования появились в то время, когда усиливаются дебаты о том, приведет ли искусственный интеллект к полному исключению людей из процесса создания контента, включая написание романов и газетных статей.

Результаты исследования, озаглавленного «Модели ИИ рушатся при обучении на рекурсивно генерируемых данных», положили конец этим дебатам — человек по-прежнему не исключается из уравнения.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

ChatGPT Gemini Google UK

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Джеффри Гого

Джеффри Гого — журналист с 20-летним опытом работы в сфере бизнеса, финансов и новостей и анализа изменения климата. Его работы публиковались в Thomson Reuters Foundation, The Zimbabwe Herald и ряде онлайн-изданий. Он также много писал об искусственном интеллекте и метавселенной, а в 2017 году начал освещать криптовалютные рынки. Гого изучал журналистику и массовые коммуникации в CCOSA в Хараре.

ОГЛАВЛЕНИЕ

1. Искусственному интеллекту по-прежнему нужны люди, чтобы понимать смысл его работы

2. Исследователи: Искусственный интеллект может усугубить предвзятое отношение к группам меньшинств

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)