Новая модель DeepSeek превосходит флагманскую по прогрессу в области искусственного интеллекта

- Компания DeepSeek выпустила новое обновление V3.1, повышающее эффективность обработки данных.
- Новое обновление стартапа превосходит RI по нескольким показателям производительности.
- Аналитики рынка ожидали, что DeepSeek выпустит преемника R1 в начале этого года.
Китайский стартап DeepSeek представил новое обновление, заявив, что оно превосходит широко известный R1 по основным показателям производительности. В сообщении в WeChat в четверг компания, занимающаяся разработкой ИИ, подтвердила, что новая версия модели, V3.1, обеспечивает более быстрые ответы на запросы и знаменует собой начало разработки ИИ-агентов.
Компания DeepSeek добавила , что модель поддерживает гибридную архитектуру рассуждений, включающую как мыслительный, так и немыслительный режимы, улучшенные возможности агента, а также болееtronпроизводительность при использовании инструментов и выполнении задач.
В DeepSeek есть кнопка «Глубокое мышление» для переключения между режимами
На данный момент официальное приложение и веб-сайт DeepSeek уже обновлены до версии 3.1, что позволяет пользователям переключаться между режимами мышления и безмышления с помощью кнопки «Глубокое мышление», аналогично тому, как работают гибридные модели Anthropic, такие как Opus и Sonnet.
Сообщается, что модель V3.1 также демонстрирует лучшие результаты в таких тестах, как SWE и Terminal-Bench, а также в тестах на эффективность мышления, чем R1. Более того, по данным Artificial Analysis, модель достигла 60 баллов по индексу интеллекта в режиме рассуждений, что немного выше 59 баллов, набранных R1. При этом базовая архитектура остается той же, с общим числом параметров 671 миллиард и 37 миллиардами активных параметров.
Несмотря на более высокую эффективность, она также использует немного меньше токенов, чем R1, в режиме рассуждений. Однако новая модель немного уступает по последней модели и модели рассуждений с открытым исходным кодом GPT-OSS от OpenAI. Кроме того, в режиме рассуждений отсутствует возможность вызова функций, что считается серьезным ограничением в агентных рабочих процессах.
Стартап впервые анонсировал новую модель во вторник, хотя на тот момент она была доступна только на платформе Hugging Face. В отдельном заявлении также сообщалось, что эта версия была адаптирована для работы на китайских чипах с искусственным интеллектом следующего поколения.
Компания представила новый тарифный план для обновленной версии V3. В соответствии с новым планом, с 6 сентября повышаются некоторые тарифы, отменяются вечерние скидки и снижаются цены в некоторых приложениях.
DeepSeek установила цены на свой Input API в размере 0,07 доллара за миллион токенов за попадание в кэш и 0,56 доллара за промах кэша, а цены на выходные токены составляют 1,68 доллара за миллион. Эти цены значительно ниже, чем у конкурентов: Gemini 2.5 Pro стоит 10 долларов за миллион выходных токенов (15 долларов за более длинные запросы), GPT-5 от OpenAI также стоит 10 долларов, а Claude Opus 4.1 от Anthropic достигает цены в 75 долларов.
Аналитики ожидали, что DeepSeek выпустит преемника R1 в начале этого года
Компания DeepSeek впервые всколыхнула Кремниевую долину запуском своей недорогой и мощной модели искусственного интеллекта R1 в январе. С тех пор эта модель остается в авангарде ускоряющегося развития ИИ в Китае, бросая вызов американским компаниям, таким как OpenAI.
Однако наблюдатели за рынком по-прежнему ждут продолжения модели R1 — возможной модели R2, запуск которой многие ожидали в начале этого года. Местные СМИ намекают, что задержка запуска связана с настойчивым стремлением основателя Лян Вэньфэна к совершенствованию модели. В то же время он управляет своим прибыльным бизнесом High-Flyer Asset Management.
Как ранее сообщал Cryptopolitan, DeepSeek отложила запуск своей модели искусственного интеллекта R2 из-за постоянных технических проблем с процессорами Huawei Ascend. После успеха модели R1 в январе китайские власти рекомендовали DeepSeek использовать чипы Huawei вместо американских продуктов Nvidia. Однако компания столкнулась со значительными проблемами на этапе обучения своей модели R2.
Источники, знакомые с ситуацией, сообщили, что DeepSeek приходилось использовать чипы Nvidia для обучения, а процессоры Huawei Ascend — только для инференции. Эксперты отрасли отмечают, что китайские чипы, включая чипы Huawei, часто отстают от Nvidia по межчиповой связи, программной поддержке и общей стабильности.
Компания Huawei направила инженеров в офис DeepSeek для помощи в адаптации модели. Тем не менее, стартапу не удалось успешно завершить обучение на оборудовании Ascend даже с помощью специалистов на месте. Первоначально запланированный на май релиз модели R2 был отложен из-за этих проблем с оборудованием.
Хотя некоторые китайские СМИ предполагают, что новая модель может быть запущена в ближайшие недели, основатель DeepSeek Лян Вэньфэн выразил внутреннее разочарование по поводу ее прогресса, призвав команду уделить необходимое время разработке модели, которая сохранит конкурентное преимущество компании.
Тем временем такие гиганты индустрии, как Alibaba и Tencent, продолжают оперативно выпускать обновления, при этом модели Qwen от Alibabatracособенноtronпоклонников.
Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















