Понимание угрозы мгновенного внедрения в системы искусственного интеллекта

- NIST предупреждает о быстрой инъекции — коварной тактике, направленной на системы искусственного интеллекта.
- Внедрение прямых подсказок обманывает модели ИИ, заставляя их совершать непредусмотренные действия, как это делает DAN.
- В качестве аргумента в защиту своих идей NIST предлагает использовать более интеллектуальные методы обучения и интерпретируемые решения в области искусственного интеллекта.
В быстро развивающемся мире искусственного интеллекта (ИИ) и машинного обучения (МО) Национальный институт стандартов и технологий (NIST) сохраняет бдительность, внимательно отслеживая жизненный цикл ИИ на предмет потенциальных уязвимостей в сфере кибербезопасности. Распространение ИИ приводит к обнаружению и использованию таких уязвимостей, что побуждает NIST разрабатывать тактики и стратегии для эффективного снижения рисков.
Понимание тактики состязательного машинного обучения (AML)
Тактика состязательного машинного обучения (AML) направлена наtracинформации о поведении систем машинного обучения, что позволяет злоумышленникам манипулировать ими в злонамеренных целях. Значительной уязвимостью среди этих тактик является внедрение импульсов, особенно в отношении моделей генеративного ИИ.
NISTdentдва основных типа внедрения подсказок: прямое и косвенное. Прямое внедрение подсказок происходит, когда пользователь вводит текст, который запускает непреднамеренные или несанкционированные действия в системе ИИ. С другой стороны, косвенное внедрение подсказок включает в себя искажение или ухудшение данных, на которые опирается модель ИИ для генерации ответов.
Один из самых известных методов прямого внедрения подсказок — DAN (Do Anything Now), используемый в основном против ChatGPT. DAN использует сценарии ролевых игр для обхода фильтров модерации, позволяя пользователям запрашивать ответы, которые в противном случае могли бы быть отфильтрованы. Несмотря на усилия разработчиков по устранению уязвимостей, версии DAN продолжают появляться, создавая постоянные проблемы для безопасности ИИ.
Защита от атак с мгновенным внедрением кода
Хотя полностью исключить атаки с внедрением подсказок может быть невозможно, NIST предлагает несколько стратегий защиты для снижения рисков. Создателям моделей рекомендуется тщательно подбирать обучающие наборы данных и обучать модели распознавать и отклонять враждебные подсказки. Кроме того, использование интерпретируемых решений на основе ИИ может помочь обнаруживать и предотвращать аномальные входные данные.
Внедрение подсказок непрямым путем представляет собой серьезную проблему из-за зависимости от манипулированных источников данных. NIST рекомендует привлекать человека к тонкой настройке моделей посредством обучения с подкреплением на основе обратной связи от человека (RLHF). Фильтрация инструкций из полученных входных данных и использование модераторов ИИ могут дополнительно усилить защиту от атак с внедрением подсказок непрямым путем.
Решения, основанные на интерпретируемости, позволяют получить представление о процессе принятия решений ИИ , помогая выявлять аномальные входные данные. Анализируя траектории прогнозирования, организации могутdentи предотвращать потенциальные атаки до того, как они проявятся.
Роль службы безопасности IBM в кибербезопасности ИИ
По мере развития сферы кибербезопасности IBM Security остается на передовой, предлагая решения на основе искусственного интеллекта для усиления защиты от новых угроз. Используя передовые технологии и экспертные знания, IBM Security помогает организациям эффективно защищать свои системы на основе ИИ.
Технологии искусственного интеллекта развиваются, как и тактика, используемая злоумышленниками, стремящимися использовать его уязвимости. Следуя рекомендациям NIST и используя инновационные решения от лидеров отрасли, таких как IBM Security, организации могут снизить риски, связанные с угрозами кибербезопасности, вызванными ИИ, и обеспечить целостность и безопасность своих систем.
Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.
Предупреждение: Предоставленная информация не является торговой рекомендацией. Cryptopolitanне несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мыtronрекомендуем провести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Брайан Куме
Брайан Куме обладает более чем семилетним опытом работы в сфере блокчейна и криптовалют, активно участвуя в отрасли с 2017 года. Он сотрудничал с ведущими изданиями, включая BlockToday.com. Кроме того, он разработал курс Ethereum 101 для BitDegree.org, прежде чем присоединиться Cryptopolitan в качестве штатного автора. Брайан пишет обзоры, проводит углубленные исследования, берет интервью и анализирует цены. Его внимание к DeFi, инновациям в блокчейне и новым криптопроектам привлекает читателей.
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















