DeepSeek выпустил R1-0528, крупное обновление модели рассуждений китайского стартапа R1, которая была выпущена в январе. Обновление прибыло всего через месяц после того, как QWEN3 Alibaba Group Hold3 победил оригинальный DeepSeek R1 в Livebench, онлайн-эталонном эталоне для моделей искусственной интеллектуальной области с открытым исходным кодом.
Модель DeepSeek обновленной R1-0528 теперь стоит вместе с ведущими моделями ИИ от Openai и Google в производительности. Возвращение показывает, как быстро крупные технологические фирмы Китая и новые технические фирмы стремятся улучшить свои инструменты искусственного интеллекта.
В своем заявлении Deepseek сказал, что R1-0528 демонстрирует лучшие рассуждения и навыки творческого письма. Обновление также приносит способность кодированияtronGer. Самое главное, что компания утверждает, что модель в настоящее время производит на 50% меньше «галлюцинаций».
DeepSeek объяснил, что обновления произошли из-за дополнительной вычислительной мощности, инвестированной на фазе после тренировки, когда инженеры настраивают модель после основного учебного процесса. На этапе после тренировки инженеры стремятся повысить эффективность модели и повысить ее точность и безопасность.
R1-0528 теперь занимает первое место за O3 и O4-Mini's Openai
На Livecodebench, который измеряет производительность модели ИИ, R1-0528 теперь занимает сразу за моделями Openai O4-Mini и O3.
«Последнее обновление DeepSeek станет острее в отношении рассуждений, StronGer по математике и коду, а также закрытие моделей высшего уровня, таких как Gemini и O3»,-сказала Адина Якефу, исследователя ИИ в Hearging Face.
Она добавила, что новая версия показывает «значительные улучшения в выводе и сокращении галлюцинации» и доказывает, что стартап не просто наверстает упущенное, но активно конкурирует.
Быстрый прогресс достиг после того, как Вашингтон ограничил передовые чипы и другие технологии экспорта в Китай. И все же китайские фирмы продолжают совершенствовать свои системы. Ранее в этом месяце Baidu и Tencent описали, как они заставляют свои модели более эффективно, несмотря на ограниченный доступ к передовым полупроводникам.
Генеральный директор NVIDIA Дженсен Хуанг раскритиковал экспортный контроль в среду. «США основали свою политику на предположении, что Китай не может сделать чипсы ИИ», - сказал он. «Это предположение всегда было сомнительным, и теперь это явно неправильно. Вопрос не в том, будет ли Китай иметь ИИ. Он уже есть».
DeepSeek повысил производительность модели Alibaba QWEN3 8B на 10%
базовую модель Alibaba QWEN3 Этот процесс создал новую, меньшую модель, которая превзошла производительность QWEN3 более чем на 10%, по данным компании. В то же время модель была в 30 раз меньше.
«Мы считаем, что цепочка размышлений от Deepseek-R1-0528 будет иметь большое значение для академических исследований по поводу моделей рассуждений и промышленных работ над небольшими моделями»,-заявила фирма.
По словам Reuters, представитель DeepSeek сообщил WeChat Group, что изменение было «незначительным обновлением испытаний», которое уже было открыто для публичных испытаний. В ответ на жесткую конкуренцию Google скинул некоторые уровни доступа к Близнецам, в то время как OpenAI представил мини-модель более дешевой O3.
Ключевой разница : Секретный инструмент Crypto Projects использует для получения гарантированного покрытия в СМИ