ПОСЛЕДНИЕ НОВОСТИ

Рост экспорта Южной Кореи на 60% привлекает миллиарды долларов из криптовалютного сектора

1 час назад Экономика
Республиканские законодатели США впервые в истории обогнали демократов по количеству владеющих криптовалютой

9 часов назад Новости
Трамп хочет получить свою долю в буме искусственного интеллекта, но никто не может договориться о том, как именно

10 часов назад Технологии
Компания Polymarket столкнулась с расследованием Wall Street Journal, поскольку объем открытых позиций на рынках прогнозов достиг рекордного уровня в 1,48 млрд долларов

16 часов назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Исследователи из Стэнфорда и Вашингтонского университета создали конкурента ChatGPT o1 с открытым исходным кодом стоимостью 50 долларов

Джай Хамид

3 минуты чтения, 6 февраля 2025 г.

Стэнфордский и Вашингтонский университеты создали модель искусственного интеллекта под названием s1 всего за 50 долларов, которая по результатам тестов по математике, логике и программированию конкурирует с моделью o1 от OpenAI.
Команда использовала модель Google Gemini 2.0, применяя недорогой метод обучения, называемый дистилляцией, и выложила весь исходный код в открытый доступ на GitHub.
Крупные игроки, такие как OpenAI, недовольны, опасаясь, что дешевые копии могут подорвать их многомиллиардные инвестиции.

Согласно опубликованному в понедельник исследовательскому отчету, ученые из Стэнфорда и Вашингтонского университета якобы совершили то, что никто не считал возможным: они создали модель ИИ под названием s1, потратив менее 50 долларов на облачные вычисления.

модель s1 демонстрирует производительность, сопоставимую с лучшими моделями логического мышления, включая o1 от OpenAI и R1 от DeepSeek. Более того, весь проект доступен на GitHub — код, данные и всё остальное.

Команда начала с того, что взяла готовую модель, вместо того чтобы создавать что-то новое. Затем они доработали её с помощью процесса, называемого дистилляцией. Согласно их исследованиям, они выделили логические способности из экспериментальной модели быстрого мышления Gemini 2.0 от Google.

Они обучили s1 имитировать методы решения задач Gemini, учась на его ответах. «Мы стремились к простоте», — сказал Никлас Мюннигхофф, один из исследователей из Стэнфорда, участвовавших в проекте.

Небольшой набор данных, большие результаты

Метод дистилляции быстро становится излюбленным инструментом команд, занимающихся разработкой ИИ и стремящихся сократить расходы. Аналогичная модель ИИ, разработанная в прошлом месяце исследователями из Беркли, обошлась в 450 долларов за обучение — по-прежнему недорого по отраслевым стандартам. Но Стэнфорд и Вашингтонский университет пошли еще дальше, снизив затраты примерно до 50 долларов за счет дистилляции своей модели с использованием меньшего набора данных и оптимизированных методов.

Исследователи отобрали всего 1000 вопросов, каждый из которых сопровождался подробными ответами и пошаговыми рассуждениями из Google Gemini 2.0. Этот набор данных предоставил все необходимые знания для достижения высокого уровня производительности. Согласно статье команды, модель научилась анализировать проблемы.

Ключевым моментом в этом процессе стала контролируемая тонкая настройка (SFT). Вместо использования обучения с подкреплением, которое требует огромных наборов данных и колоссальных вычислительных мощностей, исследователи выбрали SFT — метод, при котором ИИ напрямую обучается имитировать поведение, обнаруженное в наборе данных. Это дешевле и быстрее, и в данном случае это сработало.

Базовая модель была предоставлена лабораторией искусственного интеллекта Qwen, принадлежащей Alibaba. Их готовая модель была доступна для бесплатной загрузки, что сделало проект еще более экономичным. Менее чем за 30 минут, используя всего 16 графических процессоров Nvidia H100, команда завершила обучение модели s1. «Сегодня мы могли бы арендовать необходимые вычислительные ресурсы примерно за 20 долларов», — сказал Мюннигхофф.

Команда «Подождать» повысила точность s1

Как сообщается, исследователи использовали хитрый приём для улучшения логического мышления модели s1: они добавили слово «ждать» во время решения задачи. Заставив модель сделать паузу и перепроверить свою работу, они повысили точность. В исследовательской работе подробно описывается, как эта корректировка дала модели s1 достаточно времени, чтобы обдумать лучшие ответы, прежде чем отправить их.

OpenAI внимательно следит за ситуацией. Они уже обвинили DeepSeek в неправомерном сборе данных из их API для создания конкурентов в области ИИ. Учитывая, насколько дешевым может быть воспроизведение данных в результате инцидента s1, крупные игроки, такие как OpenAI, не в восторге. Стандартизация моделей ИИ может негативно сказаться на их прибыли.

Но у технологической компании есть и другие проблемы. Во вторник юридическая команда Илона Маска столкнулась с OpenAI в федеральном суде Окленда. Илон, который был одним из первых инвесторов в OpenAI, утверждает, что компания отказалась от своей некоммерческой миссии и предала свои первоначальные цели.

Он подал иск, чтобы заблокировать их переход к полностью коммерческому бизнесу. Адвокат Илона, Марк Тоберофф, заявил в суде в пятницу, что Илон инвестировал 45 миллионов долларов в OpenAI в период с момента основания компании до 2018 года, поскольку он верил, что компания всегда будет ставить общественную пользу выше прибыли, как и заявляла в самом начале.

Судья Ивонн Гонсалес Роджерс назвала это «натяжкой» и задалась вопросом, почему Илон вообще вложил бы такие деньги без письменногоtrac. «Это просто огромная сумма, оплаченная рукопожатием», — насмешливо заметила она. Затем адвокат Тоберофф объяснил, что у Илона и генерального директора OpenAI Сэма Альтмана в то время были близкие отношения, и все строилось на доверии.

Но дело еще не закрыто. Судью беспокоят тесные связи OpenAI с Microsoft. Два ключевых игрока — соучредитель LinkedIn Рид Хоффман и руководитель Microsoft Дианна Темплтон — входили в совет директоров OpenAI. Темплтон была включена в совет без права голоса после кратковременного отстранения Альтмана в 2023 году, но позже была исключена из-за опасений по поводу нарушения антимонопольного законодательства.

Илон хочет сорвать их планы и, возможно, получить больший контроль над компанией через собственное предприятие в области искусственного интеллекта, xAI, которое он также включил в качестве истца по делу. OpenAI утверждает, что запрос Илона нанесетripple ее бизнесу и основан на «надуманных» претензиях.

Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.

ChatGPT Gemini OpenAI

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Джай Хамид

Джай Хамид последние 6 лет освещает криптовалюты, фондовые рынки, технологии, мировую экономику и геополитические события, влияющие на рынки. Она сотрудничала с изданиями, посвященными блокчейну, такими как AMB Crypto, Coin Edition и CryptoTale, занимаясь анализом рынка, крупными компаниями, регулированием и макроэкономическими тенденциями. Она училась в Лондонской школе журналистики и трижды делилась своими взглядами на криптовалютный рынок на одном из ведущих телеканалов Африки.

ОГЛАВЛЕНИЕ

1. Небольшой набор данных, большие результаты

2. Команда «Подождать» повысила точность s1

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)