ПОСЛЕДНИЕ НОВОСТИ

жить В прямом эфире: Федеральная резервная система сохранила процентные ставки без изменений на первом заседании Кевина Уорша

17 июня 2026 г. — Прямая трансляция.
Лидеры G7 призывают к скоординированным мерам по борьбе с северокорейской системой кражи криптовалюты

8 минут назад Новости
Почему акции SpaceX сейчас резко падают?

27 минут назад Технологии
Microsoft вырвалась вперед, поскольку конкуренты избегают быстрорастущего китайского рынка искусственного интеллекта

2 часа назад Технологии

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Исследования показывают, что модели искусственного интеллекта осваивают свои возможности задолго до того, как начинают их демонстрировать

Автор:

Овотунсе Адебайо

3 минуты чтения, 24 ноября 2024 г.

Исследования показывают, что модели искусственного интеллекта осваивают свои возможности задолго до того, как начинают их демонстрировать

Исследования показали, что модели искусственного интеллекта осваивают свои возможности задолго до того, как начинают их демонстрировать.
Исследователи утверждают, что модели способны усваивать концепции задолго до того, как их продемонстрируют.
Исследователи раскрывают различные методы выявления скрытых возможностей.

Новое исследование показало, что модели искусственного интеллекта (ИИ) обладают некоторыми возможностями задолго до того, как проявляют их во время обучения. Согласно исследованию, проведенному Гарвардским университетом и Мичиганским университетом, модели не демонстрируют эти способности до тех пор, пока в них не возникнет необходимость в том или ином виде.

Данное исследование — одно из многих, проведенных для понимания того, как модели искусственного интеллекта формируют свои возможности, прежде чем демонстрировать их.

В исследовании анализировалось, как модели ИИ усваивают базовые понятия, такие как размер и цвет, и выяснилось, что они осваивают эти навыки раньше, чем показывают большинство тестов. Исследование также позволило понять сложность измерения возможностей ИИ. «Модель может казаться некомпетентной при стандартных запросах, в то время как на самом деле она обладает сложными способностями, которые проявляются только при определенных условиях», — говорится в статье.

Исследования показывают, что модели искусственного интеллекта усваивают концепции

Гарвардский университет и Мичиганский университет не первые, кто пытается понять возможности моделей ИИ: исследователи из Anthropic опубликовали статью под названием «обучение словарям». В статье обсуждалось сопоставление связей в их языке Клода с конкретными понятиями, которые он понимает. Хотя большинство этих исследований проводились под разными углами, их основная цель — понять модели ИИ.

В исследовании Anthropic были обнаружены признаки, которые можно связать с различными интерпретируемыми понятиями. «Мы обнаружили миллионы признаков, которые, по-видимому, соответствуют интерпретируемым понятиям, начиная от конкретных объектов, таких как люди, страны и известные здания, и заканчиваяtracидеями, такими как эмоции, стили письма и этапы рассуждения», — говорится в отчете.

В ходе своих исследований ученые провели несколько экспериментов, используя диффузионную модель, одну из самых популярных архитектур для ИИ. В ходе экспериментов они обнаружили, что модели используют различные способы манипулирования базовыми понятиями. Закономерности были последовательными: модели ИИ демонстрировали новые возможности на разных этапах, а также наблюдалась резкая точка перехода, сигнализирующая о приобретении новой способности.

В ходе обучения модели показали, что освоили концепции примерно на 2000 шагов раньше, чем это выявил бы стандартный тест.tronконцепции появились примерно на 6000 шагах, а более слабые — примерно на 20000 шагах. После корректировки сигналов концепций была обнаружена прямая корреляция со скоростью обучения.

Исследователи раскрывают методы доступа к скрытым возможностям

Исследователи использовали альтернативные методы подсказок, чтобы выявить скрытые возможности до того, как они проявились в стандартных тестах. Широкое распространение скрытых возможностей влияет на оценку и безопасность ИИ. Например, традиционные бенчмарки могут упускать из виду определенные возможности моделей ИИ, тем самым не учитывая как полезные, так и вызывающие опасения.

В ходе исследования команда разработала определенные методы доступа к скрытым возможностям моделей ИИ. Эти методы получили названия «линейное латентное вмешательство» и «чрезмерное подсказывание», поскольку исследователи заставляли модели демонстрировать сложное поведение до того, как оно проявится в стандартных тестах. Исследователи также обнаружили, что модели ИИ манипулировали определенными сложными характеристиками, прежде чем демонстрировали их с помощью стандартных подсказок.

Например, моделям могли предложить успешно сгенерировать «улыбающихся женщин» или «мужчин в шляпах», прежде чем попросить их объединить. Однако исследования показали, что они научились объединять их раньше, но не смогут продемонстрировать это с помощью обычных подсказок. Можно сказать, что модели, демонстрирующие свои возможности, находятся в состоянии «познания» — ситуации, когда модели показывают идеальные результаты тестирования после длительного обучения. Однако исследователи отметили, что между этими двумя состояниями есть существенные различия.

Хотя процесс освоения понятий происходит после нескольких тренировочных сессий и включает в себя уточнение нескольких распределений одних и тех же наборов данных, исследование показывает, что эти возможности проявляются в ходе активного обучения. Исследователи отметили, что модели находили новые способы манипулирования понятиями посредством изменения фаз, а не постепенного улучшения представления в процессе освоения понятий.

Согласно исследованию, модели ИИ знают эти концепции, но не способны их продемонстрировать. Это похоже на ситуацию, когда люди смотрят и понимают иностранный фильм, но не говорят на этом языке. Это показывает, что большинство моделей обладают большими возможностями, чем демонстрируют, а также демонстрирует сложность понимания и управления этими возможностями.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Соединенные Штаты

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Овотунсе Адебайо

Адебайо — писатель с четырехлетним опытом работы в криптопространстве. Он окончил Университет Лагоса, где изучал городское и региональное планирование. Адебайо работал в Tokenhell и CryptoTicker, где писал новости о криптовалютах и финтехе. В настоящее время он является автором новостей для Cryptopolitan.

ОГЛАВЛЕНИЕ

1. Исследования показывают, что модели искусственного интеллекта усваивают концепции

2. Исследователи раскрывают методы доступа к скрытым возможностям

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)