FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

Последние задачи DeepSeek по обновлению AI Algages Alibaba Qwen3 и Openai's O3 модели

В этом посте:

  • DeepSeek выпустил R1-0528 в качестве основного повышения своей модели R1 после того, как QWEN3 от Alibaba превзошел ее.
  • R1-0528 теперь соответствует моделям из крупных технологических фирм, таких как Openai O3, O4-Mini и Google Gemini 2.5-Pro.
  • Команда дистиллировала цепочку размышлений R1-0528 в меньшую базовую версию QWEN3 8B, которая превосходит оригинал на 10%.

DeepSeek выпустил R1-0528, крупное обновление модели рассуждений китайского стартапа R1, которая была выпущена в январе. Обновление прибыло всего через месяц после того, как QWEN3 Alibaba Group Hold3 победил оригинальный DeepSeek R1 в Livebench, онлайн-эталонном эталоне для моделей искусственной интеллектуальной области с открытым исходным кодом.

Модель DeepSeek обновленной R1-0528 теперь стоит вместе с ведущими моделями ИИ от Openai и Google в производительности. Возвращение показывает, как быстро крупные технологические фирмы Китая и новые технические фирмы стремятся улучшить свои инструменты искусственного интеллекта.

В своем заявлении Deepseek сказал, что R1-0528 демонстрирует лучшие рассуждения и навыки творческого письма. Обновление также приносит способность кодированияtronGer. Самое главное, что компания утверждает, что модель в настоящее время производит на 50% меньше «галлюцинаций».

DeepSeek объяснил, что обновления произошли из-за дополнительной вычислительной мощности, инвестированной на фазе после тренировки, когда инженеры настраивают модель после основного учебного процесса. На этапе после тренировки инженеры стремятся повысить эффективность модели и повысить ее точность и безопасность.

R1-0528 теперь занимает первое место за O3 и O4-Mini's Openai

На Livecodebench, который измеряет производительность модели ИИ, R1-0528 теперь занимает сразу за моделями Openai O4-Mini и O3.

«Последнее обновление DeepSeek станет острее в отношении рассуждений, StronGer по математике и коду, а также закрытие моделей высшего уровня, таких как Gemini и O3»,-сказала Адина Якефу, исследователя ИИ в Hearging Face.

Она добавила, что новая версия показывает «значительные улучшения в выводе и сокращении галлюцинации» и доказывает, что стартап не просто наверстает упущенное, но активно конкурирует.

См. Также  Antropic делает все возможное для защиты trac .

Быстрый прогресс достиг после того, как Вашингтон ограничил передовые чипы и другие технологии экспорта в Китай. И все же китайские фирмы продолжают совершенствовать свои системы. Ранее в этом месяце Baidu и Tencent описали, как они заставляют свои модели более эффективно, несмотря на ограниченный доступ к передовым полупроводникам.

Генеральный директор NVIDIA Дженсен Хуанг раскритиковал экспортный контроль в среду. «США основали свою политику на предположении, что Китай не может сделать чипсы ИИ», - сказал он. «Это предположение всегда было сомнительным, и теперь это явно неправильно. Вопрос не в том, будет ли Китай иметь ИИ. Он уже есть».

DeepSeek повысил производительность модели Alibaba QWEN3 8B на 10%

базовую модель Alibaba QWEN3 Этот процесс создал новую, меньшую модель, которая превзошла производительность QWEN3 более чем на 10%, по данным компании. В то же время модель была в 30 раз меньше.

«Мы считаем, что цепочка размышлений от Deepseek-R1-0528 будет иметь большое значение для академических исследований по поводу моделей рассуждений и промышленных работ над небольшими моделями»,-заявила фирма.

По словам Reuters, представитель DeepSeek сообщил WeChat Group, что изменение было «незначительным обновлением испытаний», которое уже было открыто для публичных испытаний. В ответ на жесткую конкуренцию Google скинул некоторые уровни доступа к Близнецам, в то время как OpenAI представил мини-модель более дешевой O3.

См. Также  Годовой доход Openai взлетел до 10 миллиардов долларов

Ключевой разница : Секретный инструмент Crypto Projects использует для получения гарантированного покрытия в СМИ

Поделиться ссылкой:

Отказ от ответственности. Предоставленная информация не является торговым советом. Cryptopolitan.com не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы tron рекомендуем провести dent исследование и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалюты, получайте ежедневные обновления на свой почтовый ящик.

Выбор редактора

Загрузка статей "Выбор редакции"...

- Крипто -информационный бюллетень, который держит вас вперед -

Рынки движутся быстро.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременную, острую и соответствующую криптографию прямо к вашему почтовым ящику.

Присоединяйтесь сейчас и
никогда не пропустите ход.

Войти. Получите факты.
Продвинуться вперед.

Подпишитесь на КриптоПолитан