При обучении на данных, сгенерированных самим ИИ, модели искусственного интеллекта выдают «бессмыслицу»

- Исследование показало, что моделям искусственного интеллекта, обученным с использованием данных, сгенерированных самим ИИ, не хватает содержательности и нюансов.
- Полученные результаты ставят перед разработчиками ИИ новую задачу.
- Исследователи призывают к осторожности при использовании данных для обучения ИИ.
большие языковые модели (LLM), обученные на предыдущих версиях сгенерированного ИИ материала, выдают результаты, лишенные содержания и нюансов. Эти выводы представляют собой новую проблему для разработчиков ИИ, которые полагаются на ограниченные наборы данных, созданных людьми, для формирования контента.
Читайте также: «Дипфейки, созданные с помощью ИИ, затрудняют американским властям защиту детей» — отчет.
Исследователи в области искусственного интеллекта из Кембриджского и Оксфордского университетов в Великобритании попытались написать подсказки, используя набор данных, состоящий исключительно из контента, сгенерированного ИИ. Результат оказался неудовлетворительным, поскольку ответы получились непонятными.
Искусственному интеллекту по-прежнему нужны люди, чтобы понимать смысл его работы
Один из авторов статьи, Жакар Шумайлов из Кембриджского университета, заявил о необходимости контроля качества данных, используемых в LLM-системах — технологии, лежащей в основе генеративных чат-ботов на основе искусственного интеллекта, таких как ChatGPT и Google Gemini. Шумайлов сказал:
«Главный посыл в том, что мы должны быть очень осторожны с тем, что попадает в наши обучающие данные. [В противном случае] всё всегда, с доказанной вероятностью, пойдёт не так».
Это явление известно как «коллапс модели», пояснил Шумайлов. Доказано, что оно затрагивает все виды моделей искусственного интеллекта, включая те, которые специализируются на генерации изображений с использованием текстовых подсказок.
Согласно исследованию ,повторные текстовые подсказки, сгенерированные искусственным интеллектом на одной из моделей, в итоге приводили к бессмысленному набору символов. Например, исследователи обнаружили, что одна система, протестированная с текстом о средневековых церковных башнях Великобритании, после всего девяти поколений выдала повторяющийся список зайцев.
Комментируя полученные результаты, специалист по информатике из Калифорнийского университета Хани Фарид сравнил обвал данных с проблемами, характерными для инбридинга у животных.
«Если вид вступает в инбридинг со своим собственным потомством и не диверсифицирует свой генофонд, это может привести к вымиранию вида», — сказал Фарид.
Когда исследователи внедрили в данные ИИ данные, сгенерированные людьми, коллапс происходил медленнее, чем когда система работала исключительно на контенте, сгенерированном ИИ.

Исследователи: Искусственный интеллект может усугубить предвзятое отношение к группам меньшинств
Языковые модели работают, устанавливая связи между токенами — словами или частями слов — в огромных массивах текста, часто собранных из интернета. Они генерируют текст, выдавая статистически наиболее вероятное следующее слово на основе этих изученных закономерностей.
Читайте также: Плюшевый мишка По, работающий на платформе ChatGPT, читает детям сказки на ночь.
Исследование, опубликованное в журнале Nature 24 июля, показало, что информация, упомянутая несколько раз в наборах данных, скорее всего, не будет повторяться. Исследователи опасаются, что это может негативно повлиять на и без того маргинализированные группы меньшинств.
Чтобы предотвратить сбой модели в реальных условиях, в исследовании предлагалось наносить водяные знаки на контент, созданный ИИ, и на контент, созданный человеком. Однако это также может бытьmatic из-за отсутствия координации между конкурирующими компаниями, занимающимися ИИ, говорится в исследовании.
Результаты исследования появились в то время, когда усиливаются дебаты о том, приведет ли искусственный интеллект к полному исключению людей из процесса создания контента, включая написание романов и газетных статей.
Результаты исследования, озаглавленного «Модели ИИ рушатся при обучении на рекурсивно генерируемых данных», положили конец этим дебатам — человек по-прежнему не исключается из уравнения.
Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
Джеффри Гого
Джеффри Гого — журналист с 20-летним опытом работы в сфере бизнеса, финансов и новостей и анализа изменения климата. Его работы публиковались в Thomson Reuters Foundation, The Zimbabwe Herald и ряде онлайн-изданий. Он также много писал об искусственном интеллекте и метавселенной, а в 2017 году начал освещать криптовалютные рынки. Гого изучал журналистику и массовые коммуникации в CCOSA в Хараре.
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)














