Новейшая модель искусственного интеллекта Alibaba, QwQ-32B-Preview, превосходит модель o1 от OpenAI в некоторых тестах производительности

- Модель Alibaba превзошла OpenAI в таких тестах, как AIME и MATH.
- Эта модель может стать шагом на пути к созданию логического искусственного интеллекта.
- Однако у этой модели есть и свои ограничения.
В условиях усиления конкуренции в сфере искусственного интеллекта китайский розничный гигант Alibaba представил свою модель QwQ-32B-Preview, которая, по сообщениям, превосходит серию o1 от OpenAI.
По имеющимся данным, новейшая модель превосходит модели OpenAI o1-preview и o1-mini по некоторым конкретным показателям, таким как тесты AIME и MATH, которые оценивают производительность моделей ИИ в логических головоломках и математических задачах.
Компания Alibaba предоставила для скачивания предварительную версию QwQ-32B.
По словам розничного гиганта, новая модель Alibaba способна решать сложные и запутанные задачи по сравнению с обычными большими языковыми моделями (LLM), такими как ChatGPT-4 и Claude 3.5.
В статье Benzinga указывается, что QwQ-32B-Preview — одна из немногих моделей, доступных по разрешительной лицензии, позволяющей пользователям загружать и использовать её. Теперь эта модель доступна на платформе для разработки ИИ Hugging Face.
Однако Alibaba опубликовала некоторые компоненты модели, чтобы ограничить возможность полного воспроизведения модели или получения информации о её работе.
Новейшая модель Alibaba может похвастаться 32,5 миллиардами параметров, что позволяет ей обрабатывать запросы объемом до 32 000 слов. Благодаря значительным возможностям модели и полуоткрытому доступу, новый игрок Alibaba создает предпосылки для кардинального скачка в технологиях логического мышления на основе искусственного интеллекта.
В своем прозрачном заявлении, подчеркивающем сложность модели Alibaba, OpenAI держит количество параметров в секрете.
Появление этой модели совпадает с периодом, когда OpenAI добивается значительных успехов в секторе искусственного интеллекта. В октябре рыночная капитализация OpenAI подскочила до 157 миллиардов долларов после успешного раунда финансирования.
Ранее на этой неделе SoftBank Group SFTBF, как сообщается, увеличила свою долю в компании-разработчике ChatGPT путем выкупа акций сотрудниками на сумму 1,5 миллиарда долларов.
Сообщается также, что OpenAI изучает возможность разработки собственного веб-браузера, который составит конкуренцию браузеру Google Chrome, принадлежащему дочерней компании Alphabet, после давления со стороны Министерства юстиции США с требованием продать его.
Компания Alibaba признает, что у этой модели тоже есть недостатки
Несмотря на наличие уникальных сильных сторон, новая модель также имеет ограничения. По данным группы разработчиков, QwQ-32B-Preview имеет такие проблемы, как неожиданные переключения языка, которые потенциально могут запутать пользователей. Модель также показывает низкую эффективность в задачах, требующих здравого смысла, что характерно для многих систем искусственного интеллекта.
Согласно AutoGPT, модель может застревать в логических циклах, что приводит к задержке ответов.
Несмотря на свои недостатки, его аналитические возможности позволяют ему проверять факты самостоятельно, тем самым сокращая количество ошибок, но увеличивая время их устранения.
Благодаря анализу задач и этапов планирования, модель Alibaba позволяет избежать некоторых недостатков, присущих традиционным системам искусственного интеллекта. Однако такой подход требует дополнительного времени, что может ограничить его применение в режиме реального времени.
Согласно Benzinga, ответы QwQ-32B-Preview соответствуют китайским нормативным стандартами избегают политически чувствительных тем.
Например, на политически чувствительные темы, такие как Тайвань, реакция будет соответствовать позиции китайского правительства.
Кроме того, запросы, касающиеся таких событий, как события на площади Тяньаньмэнь, не приводят к каким-либо ответам, что свидетельствует об осторожном подходе к разработке модели.
Хотя это может быть идеальным вариантом для китайского рынка, это также может ограничить его привлекательность на мировом рынке. Тем не менее, эта модель представляет собой значительный шаг в мир логического ИИ. Хотя её ограничения могут сузить её глобальную привлекательность, другие её компоненты, такие как логика и полуоткрытый характер, делают её серьёзным конкурентом для OpenAI.
Согласно AutoGPT, QwQ-32B-Preview демонстрирует потенциал и проблемы этой захватывающей области, где лаборатории искусственного интеллекта по всему миру работают над совершенствованием технологий логического мышления.
Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)














