ПОСЛЕДНИЕ НОВОСТИ

жить Bitcoin резко упал до отметки в 67 000 долларов впервые с февраля

6 часов назад Обновления в режиме реального времени
ChatGPT преодолел отметку в 1 миллиард ежемесячных пользователей, в то время как Клод снижает вовлеченность пользователей

36 минут назад Технологии
Coinbase объявила об инвестициях Ethena в расширение своей деятельности в сфере «ончейн-финансов»

4 часа назад Новости
Виталик присоединяется к тренду дедолларизации, выдвигая радикальное предложение по созданию стейблкоина, отличного от доллара США

4 часа назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Модель рассуждений OpenAI часто «думает» на китайском языке — никто не может объяснить почему

Флоренс Мучай

3 минуты чтения, 14 января 2025 г.

Модель рассуждений OpenAI часто «думает» на китайском языке — никто не может объяснить почему

Первоначальная модель искусственного интеллекта OpenAI o1, использующая «логику рассуждений», испытывает трудности с обеспечением согласованности ответов на вопросы на одном языке.
Эксперты утверждают, что в процессе рассуждений OpenAI o1 находится под влиянием китайской лингвистики.
Компания OpenAI не признала языковую слабость o1.

Пользователи OpenAIdentуязвимость. Вскоре после публикации OpenAI модели o1, своей первой модели «рассуждений» на основе искусственного интеллекта, было замечено странное поведение. Оказывается, когда запрос задается на английском языке, модель иногда начинает «думать» на языке, отличном от английского, например, на китайском или персидском.

Один пользователь написал: «[O1] внезапно начал думать по-китайски где-то в середине». Кроме того, совершенно другой пользователь на X также спросил: «Почему [o1] внезапно начал думать по-китайски?»

Почему o1 pro внезапно начал думать на китайском? Ни одна часть разговора (более 5 сообщений) не была на китайском… очень интересно… влияние обучающих данных pic.twitter.com/yZWCzoaiit

– Ришаб Джайн (@RishabJainK) 9 января 2025 г.

Согласно наблюдениям, при возникновении проблемы, требующей решения, o1 начинает свой «мыслительный» процесс, включающий последовательность шагов рассуждения, ведущих к ответу. Окончательный ответ o1 будет на английском языке, если запрос будет написан на этом языке.

Тем не менее, перед формулированием своего вывода модель будет выполнять определенные процедуры на другом языке.

Примечательно, что OpenAI не предоставила объяснения странному поведению o1 и даже не признала его. Так в чем же может быть причина?

Вот некоторые теории специалистов в области искусственного интеллекта.

Генеральный директор Hugging Face Клеман Деланг упомянул на X , что модели логического мышления, такие как o1, обучаются на наборах данных с большим количеством китайских иероглифов.

Кроме того, по словам Теда Сяо, исследователя из Google DeepMind, такие организации, как OpenAI, используют сторонние сервисы разметки данных на китайском языке, и переход на китайский язык является примером «китайского языкового влияния на рассуждения»

Тед Сяо написал в посте на X: «Лаборатории, занимающиеся разработкой искусственного общего интеллекта, такие как OpenAI и Anthropic, используют сторонние сервисы разметки данных для обработки информации на уровне докторской диссертации в науке, математике и программировании; из-за доступности квалифицированной рабочей силы и стоимости многие из этих поставщиков данных находятся в Китае».

По всей видимости, в процессе обучения метки, которые также называютсяdentили аннотациями, помогают моделям понимать и интерпретировать данные.

Например, метки, используемые для обучения модели распознавания изображений, могут состоять из подписей, которые относятся к каждому человеку, месту или объекту, изображенному на изображении, или из обозначений, окружающих объекты.

Кроме того, исследования показали, что предвзятая классификация может приводить к предвзятым моделям. Например, среднестатистический аннотатор более склонен помечать фразы на афроамериканском диалекте английского языка (AAVE).

Это известно как неформальная грамматика, используемая некоторыми афроамериканцами и считающаяся токсичной. В результате, детекторы токсичности на основе искусственного интеллекта, обученные на этих обозначениях, воспринимают AAVE как чрезмерно токсичный.

Тем не менее, теория разметки китайских данных o1 не принимается другими экспертами. Они подчеркивают, что o1 с одинаковой вероятностью может перейти на хинди, тайский или любой другой язык, помимо китайского, при попытке сформулировать решение.

Напротив, эти эксперты утверждают, что o1 и другие модели рассуждений, возможно, используют наиболее эффективные языки для достижения цели.

В связи с этим исследователь в области искусственного интеллекта Мэтью Гуздиал сказал: «Модель не знает, что такое язык или что языки бывают разными». Это связано с тем, что токены, подобно маркировке, потенциально могут вносить предвзятость.

В частности, различные пословные переводчики исходят из предположения, что пробел в предложении обозначает новое слово. Это происходит независимо от того, что не во всех языках пробелы используются для разделения слов.

Однако Лука Сольдайни, научный сотрудник некоммерческого Института искусственного интеллекта имени Аллена, подчеркнул, что с уверенностью это определить невозможно. Он заявил: «Такие наблюдения в отношении развернутой системы ИИ невозможно подтвердить из-за непрозрачности этих моделей […] Это один из многочисленных примеров, когда подчеркивается важность прозрачности при создании систем ИИ».

Проблемы OpenAI

2024 год стал для OpenAI настоящими американскими горками. Компания и её генеральный директор Сэм Альтман начали год с судебного иска со стороны Илона Маска. Он утверждал, что компания отошла от своей первоначальной некоммерческой цели, сделав упор на прибыль, а не на общественную пользу.

За последний год восемь американских газет, включая New York Daily News, Chicago Tribune и Denver Post, подали в суд на OpenAI и Microsoft. Они обвинили компанию в использовании миллионов защищенных авторским правом публикаций для обучения чат-ботов с искусственным интеллектом без разрешения и оплаты. Они утверждали, что эта технология нарушает их права интеллектуальной собственности.

Кроме того, Мира Мурати, технический директор OpenAI, объявила о своем уходе. Это был ключевой момент, поскольку ее технологические навыки имели решающее значение для развития компании.

Кроме того, OpenAI столкнулась с рядом трудностей при работе с ChatGPT, таких как периодические сбои, ошибки, приводившие к неточным или бессмысленным ответам от чат-бота, и опасения по поводу конфиденциальности пользователей. Также были случаи, когда ИИ генерировал предвзятый или оскорбительный контент.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.

OpenAI

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Флоренс Мучай

Флоренс последние 6 лет освещает новости в сфере криптовалют, игр, технологий и искусственного интеллекта. Ее образование в области компьютерных наук в Университете науки и технологий Меру и в области управления стихийными бедствиями и международной дипломатии в MMUST обеспечили ей богатый опыт в изучении языков, наблюдательности и технических навыках. Флоренс работала в VAP Group и редактором в нескольких криптомедийных изданиях.

ОГЛАВЛЕНИЕ

1. Вот некоторые теории специалистов в области искусственного интеллекта.

2. Проблемы OpenAI

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)