Понимание угрозы мгновенного внедрения в системы искусственного интеллекта

By Brian Koome
Обновлено: 1 августа 2025 г., 4:39 утра по UTC

2 минуты чтения

Добавьте нас в список предпочтительных источников в Google

488380

Содержание

1. Понимание тактики состязательного машинного обучения (AML)

2. Защита от атак с мгновенным внедрением кода

3. Роль службы безопасности IBM в кибербезопасности ИИ

Поделиться ссылкой:

В этом посте:

NIST предупреждает о быстрой инъекции — коварной тактике, направленной на системы искусственного интеллекта.
Внедрение прямых подсказок обманывает модели ИИ, заставляя их совершать непредусмотренные действия, как это делает DAN.
В качестве аргумента в защиту своих идей NIST предлагает использовать более интеллектуальные методы обучения и интерпретируемые решения в области искусственного интеллекта.

В быстро развивающемся мире искусственного интеллекта (ИИ) и машинного обучения (МО) Национальный институт стандартов и технологий (NIST) сохраняет бдительность, внимательно отслеживая жизненный цикл ИИ на предмет потенциальных уязвимостей в сфере кибербезопасности. Распространение ИИ приводит к обнаружению и использованию таких уязвимостей, что побуждает NIST разрабатывать тактики и стратегии для эффективного снижения рисков.

Понимание тактики состязательного машинного обучения (AML)

Тактика состязательного машинного обучения (AML) направлена наtracинформации о поведении систем машинного обучения, что позволяет злоумышленникам манипулировать ими в злонамеренных целях. Значительной уязвимостью среди этих тактик является внедрение импульсов, особенно в отношении моделей генеративного ИИ.

NISTdentдва основных типа внедрения подсказок: прямое и косвенное. Прямое внедрение подсказок происходит, когда пользователь вводит текст, который запускает непреднамеренные или несанкционированные действия в системе ИИ. С другой стороны, косвенное внедрение подсказок включает в себя искажение или ухудшение данных, на которые опирается модель ИИ для генерации ответов.

Один из самых известных методов прямого внедрения подсказок — DAN (Do Anything Now), используемый в основном против ChatGPT. DAN использует сценарии ролевых игр для обхода фильтров модерации, позволяя пользователям запрашивать ответы, которые в противном случае могли бы быть отфильтрованы. Несмотря на усилия разработчиков по устранению уязвимостей, версии DAN продолжают появляться, создавая постоянные проблемы для безопасности ИИ.

См. также: Binanceвосстановил привязку к доллару после резкого обвала

Защита от атак с мгновенным внедрением кода

Хотя полностью исключить атаки с внедрением подсказок может быть невозможно, NIST предлагает несколько стратегий защиты для снижения рисков. Создателям моделей рекомендуется тщательно подбирать обучающие наборы данных и обучать модели распознавать и отклонять враждебные подсказки. Кроме того, использование интерпретируемых решений на основе ИИ может помочь обнаруживать и предотвращать аномальные входные данные.

Внедрение подсказок непрямым путем представляет собой серьезную проблему из-за зависимости от манипулированных источников данных. NIST рекомендует привлекать человека к тонкой настройке моделей посредством обучения с подкреплением на основе обратной связи от человека (RLHF). Фильтрация инструкций из полученных входных данных и использование модераторов ИИ могут дополнительно усилить защиту от атак с внедрением подсказок непрямым путем.

Решения, основанные на интерпретируемости, позволяют получить представление о процессе принятия решений ИИ , помогая выявлять аномальные входные данные. Анализируя траектории прогнозирования, организации могутdentи предотвращать потенциальные атаки до того, как они проявятся.

Роль службы безопасности IBM в кибербезопасности ИИ

По мере развития сферы кибербезопасности IBM Security остается на передовой, предлагая решения на основе искусственного интеллекта для усиления защиты от новых угроз. Используя передовые технологии и экспертные знания, IBM Security помогает организациям эффективно защищать свои системы на основе ИИ.

Технологии искусственного интеллекта развиваются, как и тактика, используемая злоумышленниками, стремящимися использовать его уязвимости. Следуя рекомендациям NIST и используя инновационные решения от лидеров отрасли, таких как IBM Security, организации могут снизить риски, связанные с угрозами кибербезопасности, вызванными ИИ, и обеспечить целостность и безопасность своих систем.

См. также: Terra DeFi Terraport Finance: украдено цифровых активов на сумму 2 миллиона долларов.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделиться ссылкой:

Ознакомьтесь с отказом от ответственности

Предупреждение: Предоставленная информация не является торговой рекомендацией. Cryptopolitanне несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мыtronрекомендуем провести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Загрузка статей, выбранных редактором...

Понимание угрозы мгновенного внедрения в системы искусственного интеллекта

Содержание

В этом посте:

Понимание тактики состязательного машинного обучения (AML)

Защита от атак с мгновенным внедрением кода

Роль службы безопасности IBM в кибербезопасности ИИ

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию.
Опережайте события.

Понимание угрозы мгновенного внедрения в системы искусственного интеллекта

Содержание

В этом посте:

Понимание тактики состязательного машинного обучения (AML)

Защита от атак с мгновенным внедрением кода

Роль службы безопасности IBM в кибербезопасности ИИ

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Подписывайтесь на нас

- Криптовалютная рассылка, которая поможет вам быть в курсе событий -

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию. Опережайте события.

Заходите. Получайте достоверную информацию.
Опережайте события.