Китайский стартап в области искусственного интеллекта (ИИ) DeepSeek представил новый метод рассуждений, в то время как рынок продолжает с нетерпением ждать выхода его модели следующего поколения. Согласно сообщениям, компания только что представила новый подход, который улучшит возможности рассуждений больших языковых моделей (LLM), пока общественность ожидает выхода новой модели.
Согласно сообщениям, в недавно опубликованной статье было раскрыто, что это достижение стало результатом сотрудничества исследователей из Университета Цинхуа и стартапа в области искусственного интеллекта. В статье говорится, что DeepSeek удалось разработать метод, сочетающий в себе методы, называемые генеративным моделированием вознаграждения (GRM), и самонастройку. Двойной подход позволит LLM-системам выдавать более качественные и быстрые результаты для общих запросов.
Компания DeepSeek представила новый метод рассуждений на основе искусственного интеллекта
По словам исследователей, полученные модели DeepSeek-GRM превзошли существующие методы, достигнув конкурентоспособных результатов по сравнению сtronобщедоступными моделями вознаграждения. Моделирование вознаграждения — это процесс, который помогает модели LLM определять предпочтения человека. Исследователи упомянули, что стартап в области ИИ намерен сделать модели GRM открытым исходным кодом, но компания пока не назвала сроки разработки.
Опубликованная научная статья появилась после предположений о потенциальном следующем шаге стартапа, который enjк себе всеобщее внимание благодаря своей базовой модели DeepSeek V3 и модели рассуждений R1. В то время модель R1, выпущенная ранее в этом году, получила известность после того, как выяснилось, что она показала лучшие результаты, чем некоторые более старые модели, включая первую модель ChatGPT от OpenAI.
Выпуск модели R1 также застал Кремниевую долину врасплох, учитывая тот факт, что модель была с открытым исходным кодом и была разработана с гораздо меньшими затратами, чем другие модели ИИ. Хотя внимание к ней, похоже, ослабевает, наблюдается значительный прогресс среди конкурирующих компаний в индустрии ИИ, что свидетельствует о том, что соперничество в этом секторе — это непреходящее явление.
Однако в прошлом месяце агентство Reuters сообщило о возможной разработке DeepSeek-2, преемника всемирно известного R1. Согласно сообщению, компания может планировать выпустить его в конце этого месяца, стремясь извлечь выгоду из своего растущего влияния в индустрии искусственного интеллекта. DeepSeek, с другой стороны, хранит молчание по поводу модели R2, сохраняя молчание в официальных публичных каналах, а служба поддержки клиентов опровергла слухи о работе с корпоративными клиентами, как сообщают СМИ.
Разработка модели V3 продолжается
Компания DeepSeek, базирующаяся в Ханчжоу, была основана в 2023 году предпринимателем Лян Вэньфэном и в последние несколько месяцев находится в центре внимания мирового сообщества по вполне заслуженным причинам. Однако компания отказывается от публичных заявлений, решив сосредоточить все свое время и энергию на исследованиях и разработках. Хотя еще предстоит увидеть, что компания предложит индустрии искусственного интеллекта, она, безусловно, уже работает над этим, судя по слухам.
В прошлом месяце компания объявила о разработке, над которой работала, представив миру обновленную модель V3 под названием DeepSeek-V3-0324. По словам компании, обновленная модель предлагает «улучшенные возможности логического мышления, оптимизированную разработку веб-интерфейсов и улучшенные навыки письма на китайском языке». В феврале компания передала на аутсорсинг пять своих репозиториев кода, что позволило разработчикам проверять и вносить свой вклад в разработку программного обеспечения. Стартап заявил, что будет добиваться «искреннего прогресса с полной прозрачностью»
В том же месяце Лян опубликовал техническое исследование по методу разреженного внимания, используемому для повышения эффективности LLM-систем при обработке больших объемов данных. 40-летний Лян также является основателем материнской компании DeepSeek, High-Flyer Quant, хедж-фонда, который предоставил финансовые ресурсы для финансирования технических разработок стартапа в области ИИ. В конце февраля предприниматель принял участие в симпозиуме, собравшем технологических предпринимателей, который проходил под председательством президента Китая Си Цзиньпина. Президент dent dent признаком устойчивости страны перед лицом попыток США сдержать прогресс Китая в области ИИ.

