FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

Исследователи Стэнфорда и UW строят 50 долларов с открытым исходным кодом Catgpt O1 конкурент

В этом посте:

  • Стэнфорд и UW построили модель ИИ под названием S1 всего за 50 долларов, соперничая Operai O1 в тестировании математики, логики и кодирования.
  • Команда использовала модель Google Gemini 2.0 с помощью дешевого метода обучения под названием Distillation и поделилась всем с открытым исходным кодом на GitHub.
  • Крупные игроки, такие как Openai, недовольны, опасаясь, что недорогие реплики могут нарушить их инвестиции в миллиард долларов.

Исследователи ИИ в Стэнфорде и Вашингтонском университете якобы осудили то, что никто не считал возможным - они построили модель ИИ под названием S1 менее чем за 50 долларов в области облачных вычислений, согласно отчету исследования, опубликованным в понедельник.

По сообщениям, модель S1 обеспечивает производительность на номинации с моделями рассуждений высшего уровня, включая Operai's O1 и Deepseek R1, согласно тестам по математике и тестам кодирования. Более того, весь проект доступен на GitHub - коде, данных и все.

Команда начала с захвата готовой модели вместо создания чего-то нового. Оттуда они настраивали его через процесс, называемый дистилляцией. Согласно их исследованию, они перегоняли способность по мышлению от экспериментальной модели Google Gemini 2.0.

Они обучали S1 имитировать методы решения проблем Близнецов, учив его на ответах. «Мы стремились к простоте», - сказал Никлас Менененгофф, один из участия в Стэнфорде.

Небольшой набор данных, большие результаты

Дистилляция быстро становится оружием, выбранным для команд искусственного интеллекта, стремящихся сократить расходы. Аналогичная модель искусственного интеллекта, разработанная в прошлом месяце исследователями Беркли, стоила 450 долларов на тренировку - все еще дешево по отраслевым стандартам. Но Стэнфорд и UW сделали еще один шаг, снизив затраты примерно до 50 долларов, перегоняя их модель с меньшим набором данных и упорядоченными методами.

Исследователи выбрали всего 1000 вопросов, каждый из которых сочетался с подробными ответами и пошаговыми рассуждениями из Google Gemini 2.0. Этот набор данных предоставил все знания S1, необходимые для выполнения на высоком уровне. Согласно документу команды, модель научилась продумывать проблемы.

См. Также  Генеральный директор British Telecom говорит, что ИИ может углубить сокращение работы

Настраиваемая тонкая настройка, или SFT, была ключом к выполнению этой работы. Вместо использования обучения подкрепления, которое требует огромных наборов данных и тонны вычислительной мощности, исследователи выбрали SFT, метод, при котором ИИ напрямую обучается имитировать поведение, обнаруженное в наборе данных. Это дешевле и быстрее, и в этом случае это сработало.

Базовая модель поступила от Qwen, лаборатории ИИ, принадлежащей Алибабе. Их готовая модель была бесплатной для загрузки, что сделало проект еще более бюджетным. Менее чем за 30 минут и используя всего 16 графических процессоров NVIDIA H100, команда закончила обучение S1. «Мы могли бы арендовать необходимый вычислитель за 20 долларов сегодня», - сказал Мененгофф.

Команда «подождать» повысила точность S1

Исследователи, как сообщается, включили умный трюк, чтобы улучшить рассуждения S1: они добавили слово «ждать» во время решения проблем. Показав модели, чтобы сделать паузу и дважды проверить ее работу, они повысили точность. Исследовательский документ подробно описывает, как эта настройка дала S1 достаточно времени, чтобы рассмотреть лучшие ответы, прежде чем отправить их.

Openai внимательно следит. Они уже обвинили DeepSeek в неправильном сборе данных из своего API для создания конкурентов ИИ. С S1, показывающим, насколько дешевой может быть репликация, крупные игроки, такие как Openai, не взволнованы. Коммодитизация моделей ИИ может повредить их прибыли.

Но у технологической компании есть другие проблемы. Во вторник юридическая команда Элона Маска столкнулась с Openai в федеральном зале суда Окленда. Элон, который был ранним инвестором в Openai, утверждает, что компания отказалась от своей некоммерческой миссии и предала свои первоначальные цели.

См. Также  Yahoo ставки на AI для обновления Major Mail за десятилетие

Он предъявляет иск, чтобы заблокировать их переход в полностью коммерческий бизнес. Адвокат Элона, Марк Тоберфофф, заявил в Суд в пятницу, что Элон вложил 45 миллионов долларов в Openai между его основанием и 2018 году, потому что он считал, что он всегда будет приоритет общественной выгоде по сравнению с прибылью, точно так же, как он сказал, что вначале.

Судья Ивонн Гонсалес Роджерс назвал это «растяжением» и спросила, почему Элон даже вложил бы столько денег без письменногоtrac. «Это всего лишь много денег на рукопожатии», - издевалась она. Адвокат Тоберфофф затем объяснил, что в то время было связано с генеральным директором Elon и Openai, Сэм Альтман, и все было построено на доверии.

Но дело еще не мертв. Судья обеспокоен тесными отношениями Openai с Microsoft. Два ключевых игрока-соучредитель Linkedin Рейд Хоффман и исполнительный директор Microsoft Deanna Templeton-были связаны с советом Openai. Templeton был добавлен в качестве члена не голоса после краткого усылки Альтмана в 2023 году, но впоследствии был удален на фоне антимонопольных проблем.

Элон хочет остановить свои планы и потенциально получить больше контроля над компанией через свое собственное предприятие искусственного интеллекта, XAI, которое он добавил в качестве истца по этому делу. Openai утверждает, что просьба Элона будетripple его бизнес и основан на «надуманных» претензиях.

Ваши криптовые новости заслуживают внимания - Wire Key Miniate ставит вас на 250 лучших сайтов

Поделиться ссылкой:

Отказ от ответственности. Предоставленная информация не является торговым советом. Cryptopolitan.com не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы tron рекомендуем провести dent исследование и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалюты, получайте ежедневные обновления на свой почтовый ящик.

Выбор редактора

Загрузка статей "Выбор редакции"...

- Крипто -информационный бюллетень, который держит вас вперед -

Рынки движутся быстро.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременную, острую и соответствующую криптографию прямо к вашему почтовым ящику.

Присоединяйтесь сейчас и
никогда не пропустите ход.

Войти. Получите факты.
Продвинуться вперед.

Подпишитесь на КриптоПолитан