Скандал вокруг наборов данных изображений, созданных с помощью ИИ: материалы с изображением сексуального насилия над детьми вызывают тревогу

Эдита Патрик

2 минуты чтения, 23 декабря 2023 г.

В наборе данных ИИ LAION-5B, имеющем решающее значение для обучения моделей, были обнаружены изображения, предположительно свидетельствующие о жестоком обращении с детьми, что повлекло за собой его удаление и проведение расследования.

Стабильная модель Diffusion AI утверждает, что внутренние фильтры блокируют незаконный контент, устраняя опасения, возникшие в связи с разногласиями вокруг набора данных LAION-5B.

Правовая неопределенность окружает наборы данных ИИ, такие как LAION-5B, поскольку исследование выявляет трудности в различении созданного ИИ контента от реального незаконного.

В недавнем расследовании Стэнфордской интернет-обсерватории была раскрыта тревожная реальность в сфере разработки искусственного интеллекта (ИИ). В крупнейшем наборе изображений LAION-5B, используемом для обучения моделей генерации изображений ИИ, обнаружено 3226 изображений, предположительно содержащих материалы сексуального насилия над детьми (CSAM). Это открытие побудило LAION оперативноtracсвой набор данных из публичного доступа, пообещав обеспечить его тщательную проверку для удаления любого небезопасного контента.

Тревожное открытие в наборе данных LAION-5B

LAION-5B, набор данных с открытым исходным кодом, содержащий более 5,8 миллиардов пар URL-адресов онлайн-изображений и соответствующих подписей, служит основой для обучения различных моделей искусственного интеллекта, включая широко популярную модель Stable Diffusion. Созданный путём парсинга интернет-ресурсов с помощью Common Crawl, набор данных привлёк пристальное внимание исследователей под руководством Дэвида Тиля из Стэнфорда, которые использовали классификаторы NSFW от LAION и PhotoDNA, распространённый инструмент модерации контента. В ходе расследования было выявлено тревожное присутствие в наборе данных предположительно CSAM, что потребовало принятия немедленных мер.

Разгадывая процесс обучения ИИ

Процесс обучения ИИ включает использование обширных наборов данных, таких как LAION-5B, что позволяет моделям обучаться и генерировать контент. Stable Diffusion, известная модель ИИ в этой области, заверила 404 Media в наличии внутренних фильтров для удаления незаконных и оскорбительных материалов из данных, используемых при обучении. Более того, компания утверждает, что эти фильтры распространяются и на генерируемые выходные данные, гарантируя отсутствие как вводимых данных, так и изображений, сгенерированных ИИ, незаконных материалов.

Правовые неопределенности и этические дилеммы

Законность таких наборов данных, как LAION-5B, становится серой зоной в соответствии с федеральным законодательством США. Хотя хранение и передача CSAM-контента однозначно незаконны, сам набор данных, содержащий только URL-адреса, а не сами изображения, лишь запутывает ситуацию. Более общая проблема заключается в растущей сложности отличия CSAM-контента, созданного ИИ, от реального незаконного контента. С распространением ИИ решение этих проблем требует сотрудничества законодателей, правоохранительных органов, технологической отрасли, академических кругов и широкой общественности.

Растущая угроза CSAM, создаваемого искусственным интеллектом

Хотя количество помеченных изображений в обширном наборе данных LAION-5B может показаться статистически незначительным (3226 из 5,8 млрд), потенциальное влияние на генеративные модели ИИ весьма существенно. Размытость границ между аутентичными CSAM-изображениями и их аналогами, сгенерированными ИИ, подчёркивает необходимость комплексного решения этой проблемы. По мере развития ИИ снижение рисков, связанных с загрязнёнными обучающими данными, становится первостепенной задачей.

На пути к решению: многосторонний подход

Исследование, проведённое Дэвидом Тилем и его командой, подчёркивает необходимость комплексного подхода к решению проблем, связанных с негативными последствиями распространения ИИ. Решения должны основываться на законодательных мерах, стратегиях правоприменения, передовом опыте отрасли, научных исследованиях и повышении осведомлённости общества. Сотрудничество этих заинтересованных сторон имеет решающее значение для ответственного подхода к решению сложных задач разработки ИИ.

Преодоление темной стороны развития искусственного интеллекта

Споры вокруг набора данных LAION-5B служат суровым напоминанием об этических проблемах, сопровождающих стремительное развитие ИИ. Пересечение технологий и общественного благополучия требует активных и совместных усилий для обеспечения этической обоснованности разработки ИИ и соответствия правовым нормам. В ближайшие годы, несомненно, будут предприняты согласованные усилия различных сторон для решения и устранения тревожных последствий, выявленных в ходе исследования Стэнфордской интернет-обсерватории. В связи с этим коллективная ответственность за предотвращение неправомерного использования технологий ИИ становится как никогда важной.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Эдита Патрик

Эдита — разносторонний аналитик в сфере финансовых технологий с глубоким пониманием блокчейна. Технологии её очень увлекают, а пересечение технологий и финансов поражает воображение. Её особый интерес к цифровым кошелькам и блокчейну помогает ей в работе с аудиторией.

ОГЛАВЛЕНИЕ

1. Тревожное открытие в наборе данных LAION-5B

2. Разгадывая процесс обучения ИИ

3. Правовые неопределенности и этические дилеммы

4. Растущая угроза CSAM, создаваемого искусственным интеллектом

5. На пути к решению: многосторонний подход

6. Преодоление темной стороны развития искусственного интеллекта

Поделитесь этой статьей