Новейшее обновление ИИ от DeepSeek бросает вызов Qwen3 от Alibaba и модели o3 от OpenAI

- DeepSeek выпустила R1-0528, значительно улучшив свою модель R1 после того, как Qwen3 от Alibaba превзошла её по показателям.
- Модель R1-0528 теперь соответствует моделям крупных технологических компаний, таких как OpenAI o3, o4-mini и Google Gemini 2.5-Pro.
- Команда разработчиков обобщила идеи R1-0528 в более компактной базовой версии Qwen3 8B, которая превосходит оригинал по характеристикам на 10%.
Компания DeepSeek выпустила R1-0528, крупное обновление модели логического мышления R1, разработанной китайским стартапом и представленной в январе. Обновление вышло всего через месяц после того, как модель Qwen3 от Alibaba Group Holding обогнала оригинальную DeepSeek R1 в LiveBench, онлайн-тесте для моделей искусственного интеллекта с открытым исходным кодом.
Обновленная модель R1-0528 от DeepSeek теперь по производительности не уступает ведущим моделям ИИ от OpenAI и Google. Это возвращение демонстрирует, как быстро крупные и новые китайские технологические компании стремятся улучшить свои инструменты искусственного интеллекта.
В своем заявлении DeepSeek отметила, что модель R1-0528 демонстрирует улучшенные навыки логического мышления и креативного письма. Обновление такжеtronвозможности программирования. Что наиболее важно, компания утверждает, что модель теперь выдает на 50% меньше «галлюцинаций»
Компания DeepSeek объяснила, что улучшения стали возможны благодаря дополнительным вычислительным мощностям, затраченным на этапе постобучения, когда инженеры дорабатывают модель после основного процесса обучения. На этапе постобучения инженеры стремятся повысить эффективность модели, а также улучшить ее точность и безопасность.
R1-0528 теперь занимает место сразу за o3 и o4-mini от OpenAI
В тесте LiveCodeBench, измеряющем производительность моделей ИИ, модель R1-0528 теперь занимает место сразу за моделями o4-mini и o3 от OpenAI.
«Последнее обновление DeepSeek демонстрирует более точную логику рассуждений,tronсильные математические и программные возможности и приближается к уровню лучших моделей, таких как Gemini и O3», — заявила Адина Якефу, исследователь в области искусственного интеллекта из Hugging Face.
Она добавила, что новая версия демонстрирует «значительные улучшения в умозаключениях и снижении галлюцинаций» и доказывает, что стартап не просто догоняет, а активно конкурирует.
Быстрый прогресс стал возможен после того, как Вашингтон ограничил экспорт передовых микросхем и других технологий в Китай. Тем не менее, китайские компании продолжают совершенствовать свои системы. Ранее в этом месяце Baidu и Tencent описали способы повышения эффективности работы своих моделей, несмотря на ограниченный доступ к передовым полупроводникам.
В среду генеральный директор Nvidia Дженсен Хуанг раскритиковал экспортный контроль. «США основывали свою политику на предположении, что Китай не может производить чипы для искусственного интеллекта, — сказал он. — Это предположение всегда вызывало сомнения, и теперь оно явно неверно. Вопрос не в том, будет ли у Китая искусственный интеллект. Он уже есть»
DeepSeek повысила производительность модели Qwen3 8B от Alibaba на 10%
Компания DeepSeek также заявила, что перенесла этапы обработки данных, использованные в R1-0528, в базовую модель Alibaba Qwen3 8B. В результате этого процесса была создана новая, более компактная модель, которая, по данным компании, превзошла производительность Qwen3 более чем на 10%. При этом размер новой модели оказался в 30 раз меньше.
«Мы считаем, что цепочка рассуждений, изложенная в DeepSeek-R1-0528, будет иметь важное значение для академических исследований в области моделей рассуждений и промышленной работы над небольшими моделями», — заявила компания.
По сообщению Reuters, представитель DeepSeek заявил в группе WeChat, что это изменение представляет собой «незначительное пробное обновление», уже открытое для публичного тестирования. В ответ на усиление конкуренции Google снизил цены на некоторые тарифные планы Gemini, а OpenAI представила более дешевую модель o3 Mini.
Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)














