Система Qwen3 от Alibaba обогнала R1 от DeepSeek и теперь лидирует среди моделей искусственного интеллекта с открытым исходным кодом

- Семейство моделей искусственного интеллекта Qwen3 от Alibaba превзошло показатель R1 компании DeepSeek и стало лучшей в мире моделью с открытым исходным кодом в таких областях, как обучение языкам, математика, программирование и анализ данных.
- Qwen3 дешев в использовании, поскольку его запуск обходится всего в 0,55 доллара за 1 миллион токенов.
- Американские производители микросхем Nvidia и Intel начали поддерживать Qwen3.
Новое семейство моделей искусственного интеллекта Qwen3 от Alibaba превзошло DeepSeek R1 и стало лучшей в мире моделью с открытым исходным кодом. Согласно сообщениям, Qwen3 показала лучшие результаты, чем R1, в тестах, измеряющих возможности моделей ИИ с открытым исходным кодом в таких областях, как обучение языкам, математика, программирование и анализ данных.
Семейство Qwen3 было представлено на прошлой неделе подразделением облачных вычислений Alibaba. Оно включает восемь улучшенных моделей с количеством параметров от 600 миллионов до 235 миллиардов. В машинном обучении параметры — это переменные в системе искусственного интеллекта во время ее обучения.
Согласно данным LiveBench , независимойdent для тестирования больших языковых моделей, до проведения этих новых тестов модель R1 от DeepSeek была лучшей в мире моделью искусственного интеллекта с открытым исходным кодом с момента ее выхода в январе. Но теперь это изменилось.
И американские, и китайские компании спешат внедрить Qwen 3
Взлет Qwen3 в рейтинге LiveBench показывает, как быстро развивается искусственный интеллект в Китае. Китайская технологическая индустрия значительно выросла благодаря инструментам с открытым исходным кодом. Открытый исходный код Alibaba позволил другим сторонним разработчикам программного обеспечения делиться проектом, исправлять неработающие ссылки или повышать производительность программы.
Однако общие результаты LiveBench показали, что Qwen3 уступает моделям o3 от OpenAI, Gemini Pro 2.5 от Google и Claude 3.7 от Anthropic, которые являются лучшими в мире моделями ИИ с закрытым исходным кодом. LiveBench утверждает, что o3-mini high, самая популярная модель ИИ от OpenAI, в целом оказалась лучшей в мире. Microsoft поддерживает OpenAI.
Для запуска o3 на каждые 1 миллион токенов требуется 10 долларов. С другой стороны, Qwen3 дешевле в использовании, поскольку его запуск обходится всего в 0,55 доллара за 1 миллион токенов. Благодаря более низкой стоимости и лучшей работе Qwen3, многие компании заявили, что поддержат новейшую модель ИИ от Alibaba сразу после её запуска.
Huawei Technologies, Moore Threads, Cambricon Technologies и Hygon Information Technology — все эти компании-производители чипов заявили о своей поддержке Qwen3.
Компания Cambricon заявила в прошлый вторник, что успешно оптимизировала Qwen3 для быстрой работы на своих графических процессорах. Это было сделано потому, что разработчики ИИ на Филиппинах хотели использовать чипы, произведенные в Китае.
Qwen3 также используется в облачных вычислительных сервисах Hyperbolic и Fireworks.ai, двух компаний, занимающихся инфраструктурой искусственного интеллекта. Американские производители микросхем Nvidia и Intel начали поддерживать Qwen3.
Многие крупные центры обработки данных в Китае, такие как центры в Пекине, Шанхае, Ханчжоу, а также в провинциях Хубэй, Цзилинь и северо-западной Шэньси, также заявили о намерении использовать модели искусственного интеллекта Qwen третьего поколения от Alibaba. Суперкомпьютерная сеть Китая также внедрила Qwen3. Эта сеть объединяет более 20 центров обработки данных в 20 городах 14 провинций.
Генеральный директор Anthropic заявил, что заявления DeepSeek были «немного преувеличены»
На деловом мероприятии соучредитель компании Anthropic, разработавшей модели искусственного интеллекта Claude, заявил, что DeepSeek по-прежнему «отстает на шесть-восемь месяцев от американских передовых компаний». Он также отметил, что недавний ажиотаж вокруг китайского стартапа «возможно, несколько преувеличен»
Компания DeepSeek привлекла внимание всего мира в конце декабря 2024 года и начале января 2025 года, представив две передовые модели искусственного интеллекта с открытым исходным кодом — V3 и R1. Эти модели были созданы с минимальными затратами и вычислительными мощностями, которые обычно требуются крупным технологическим компаниям для проектов магистратуры.
Неясно, когда DeepSeek выпустит следующее поколение своих моделей. Компания из Ханчжоу незаметно выпустила свою модель Prover-V2 с 671 миллиардом параметров в конце апреля. Это было обновление её специализированной модели для обработки математических доказательств. Однако она ничего не сообщила о ходе разработки своей долгожданной модели рассуждений R2.
Вы всё ещё позволяете банку оставлять себе лучшие результаты? Посмотрите наше бесплатное видео о том, как стать собственным банком.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















