ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Ключевая работа Пола Кристиано и Бет Барнс по повышению безопасности ИИ

КДеррик КлинтонДеррик Клинтон
2 минуты чтения,
Безопасность

  • Вопросы согласованности и безопасности ИИ переместились с периферии в центр внимания индустрии искусственного интеллекта.
  • Пол Кристиано и Бет Барнс — ключевые фигуры в деле популяризации мер по обеспечению безопасности ИИ.
  • Исследовательский центр Alignment Research Center (ARC) и инициатива ARC Evals играют решающую роль в оценке и обеспечении ответственного развития технологий искусственного интеллекта.

В рамках кардинального сдвига в сторону приоритетного согласования ИИ, ведущая мировая компания в области ИИ направляет значительную часть своих вычислительных ресурсов, оцениваемых в миллиарды долларов, на решение критической проблемы несоответствия. Этот шаг знаменует собой значительную эволюцию в позиции индустрии ИИ в отношении согласования искусственного интеллекта с человеческими ценностями, переводя проблемы с периферии на передний план.

Ключевые фигуры в обеспечении безопасности ИИ

Пол Кристиано и Бет Барнс стали ключевыми фигурами в повествовании о том, как безопасность ИИ становится общепринятой. Кристиано, давний сторонник предотвращения катастроф в сфере ИИ, сыграл решающую роль в разработке доминирующего подхода к обучению с подкреплением на основе обратной связи от человека (RLHF) в OpenAI. Однако, не удовлетворившись существующим положением дел, Кристиано основал Центр исследований соответствия (ARC) для изучения инновационных методов, таких как «выявление скрытых знаний» (ELK), чтобы гарантировать, что модели ИИ соответствуют человеческим ценностям.

Бет Барнс и инициатива ARC по оценке

Бет Барнс, опытный исследователь с опытом работы в Google DeepMind и OpenAI, объединяет усилия с Кристиано в ARC. Возглавляя инициативу ARC Evals, Барнс проводит тщательную оценку моделей в сотрудничестве с крупными лабораториями, такими как OpenAI, DeepMind и Anthropic. Этот критически важный процесс проверяет модели ИИ на наличие потенциально опасных возможностей, таких как способность создавать фишинговые страницы или манипулировать взаимодействием с людьми. Примечательно, что эксперимент Барнс и ее команды с использованием GPT-4 и TaskRabbit для обмана человека в тесте CAPTCHA подчеркивает реальные последствия их работы.

Двойная миссия ARC

Миссия ARC выходит за рамки исследований, и Бет Барнс возглавляет ARC Evals как отдельное подразделение. Команда экспертов сотрудничает с ведущими лабораториями искусственного интеллекта, чтобы тщательно проверять модели на предмет их потенциального неправомерного использования и вредоносных возможностей. Проверяя модели ИИ, ARC Evals обеспечивает прозрачность и подотчетность в разработке передовых технологий искусственного интеллекта.

Анализ революции в сфере безопасности, осуществляемой с помощью искусственного интеллекта

По мере развития технологий безопасности ИИ работа Кристиано и Барнса в ARC служит образцом в этой области. Поиск инновационных методов, таких как ELK, демонстрирует стремление опережать события по мере дальнейшего развития возможностей ИИ. Их внушительная репутация в кругах, занимающихся вопросами безопасности ИИ, подчеркивает серьезность стоящей перед ними проблемы и необходимость того, чтобы такие эксперты, как Кристиано и Барнс, решали ее напрямую.

Репутация ARC и ARC Evals стала настолько внушительной в кругах специалистов по безопасности ИИ, что признание сложности этой области превратилось в шутливый мем. Послание ясно: допустимо не соответствовать интеллектуальному уровню таких фигур, как Кристиано и Барнс. Действительно важно совместное решение серьезных проблем, связанных с ИИ, обеспечение ответственной разработки и внедрения этих преобразующих технологий.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС