Компания DeepSeek представила новый метод логического мышления на основе искусственного интеллекта на фоне ожиданий выхода модели следующего поколения

Автор:

Овотунсе Адебайо

3 минуты чтения, 6 апреля 2025 г.

Компания Deepseek представила новый метод логического мышления на основе искусственного интеллекта в преддверии выхода своей модели следующего поколения.

Китайский стартап DeepSeek, специализирующийся на искусственном интеллекте, представил новый метод логического мышления в рамках ожидания рынка его модели следующего поколения.
Компания DeepSeek представила новый метод анализа данных с помощью искусственного интеллекта, при этом она хранит молчание по поводу возможного выпуска модели R2.
Китайский стартап в области искусственного интеллекта сосредоточился на исследованиях и разработках, выпустив обновленную версию своей модели V3.

Китайский стартап в области искусственного интеллекта (ИИ) DeepSeek представил новый метод рассуждений, в то время как рынок продолжает с нетерпением ждать выхода его модели следующего поколения. Согласно сообщениям, компания только что представила новый подход, который улучшит возможности рассуждений больших языковых моделей (LLM), пока общественность ожидает выхода новой модели.

Согласно сообщениям, в недавно опубликованной статье было раскрыто, что это достижение стало результатом сотрудничества исследователей из Университета Цинхуа и стартапа в области искусственного интеллекта. В статье говорится, что DeepSeek удалось разработать метод, сочетающий в себе методы, называемые генеративным моделированием вознаграждения (GRM), и самонастройку. Двойной подход позволит LLM-системам выдавать более качественные и быстрые результаты для общих запросов.

Компания DeepSeek представила новый метод рассуждений на основе искусственного интеллекта

По словам исследователей, полученные модели DeepSeek-GRM превзошли существующие методы, достигнув конкурентоспособных результатов по сравнению сtronобщедоступными моделями вознаграждения. Моделирование вознаграждения — это процесс, который помогает модели LLM определять предпочтения человека. Исследователи упомянули, что стартап в области ИИ намерен сделать модели GRM открытым исходным кодом, но компания пока не назвала сроки разработки.

Опубликованная научная статья появилась после предположений о потенциальном следующем шаге стартапа, который enjк себе всеобщее внимание благодаря своей базовой модели DeepSeek V3 и модели рассуждений R1. В то время модель R1, выпущенная ранее в этом году, получила известность после того, как выяснилось, что она показала лучшие результаты, чем некоторые более старые модели, включая первую модель ChatGPT от OpenAI.

Выпуск модели R1 также застал Кремниевую долину врасплох, учитывая тот факт, что модель была с открытым исходным кодом и была разработана с гораздо меньшими затратами, чем другие модели ИИ. Хотя внимание к ней, похоже, ослабевает, наблюдается значительный прогресс среди конкурирующих компаний в индустрии ИИ, что свидетельствует о том, что соперничество в этом секторе — это непреходящее явление.

Однако в прошлом месяце агентство Reuters сообщило о возможной разработке DeepSeek-2, преемника всемирно известного R1. Согласно сообщению, компания может планировать выпустить его в конце этого месяца, стремясь извлечь выгоду из своего растущего влияния в индустрии искусственного интеллекта. DeepSeek, с другой стороны, хранит молчание по поводу модели R2, сохраняя молчание в официальных публичных каналах, а служба поддержки клиентов опровергла слухи о работе с корпоративными клиентами, как сообщают СМИ.

Разработка модели V3 продолжается

Компания DeepSeek, базирующаяся в Ханчжоу, была основана в 2023 году предпринимателем Лян Вэньфэном и в последние несколько месяцев находится в центре внимания мирового сообщества по вполне заслуженным причинам. Однако компания отказывается от публичных заявлений, решив сосредоточить все свое время и энергию на исследованиях и разработках. Хотя еще предстоит увидеть, что компания предложит индустрии искусственного интеллекта, она, безусловно, уже работает над этим, судя по слухам.

В прошлом месяце компания объявила о разработке, над которой работала, представив миру обновленную модель V3 под названием DeepSeek-V3-0324. По словам компании, обновленная модель предлагает «улучшенные возможности логического мышления, оптимизированную разработку веб-интерфейсов и улучшенные навыки письма на китайском языке». В феврале компания передала на аутсорсинг пять своих репозиториев кода, что позволило разработчикам проверять и вносить свой вклад в разработку программного обеспечения. Стартап заявил, что будет добиваться «искреннего прогресса с полной прозрачностью»

В том же месяце Лян опубликовал техническое исследование по методу разреженного внимания, используемому для повышения эффективности LLM-систем при обработке больших объемов данных. 40-летний Лян также является основателем материнской компании DeepSeek, High-Flyer Quant, хедж-фонда, который предоставил финансовые ресурсы для финансирования технических разработок стартапа в области ИИ. В конце февраля предприниматель принял участие в симпозиуме, собравшем технологических предпринимателей, которыйdent проходил под председательством президента Китая Си Цзиньпина. Президентdent признаком устойчивости страны перед лицом попыток США сдержать прогресс Китая в области ИИ.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.

CNY DeepSeek

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Овотунсе Адебайо

Адебайо — писатель с четырехлетним опытом работы в криптопространстве. Он окончил Университет Лагоса, где изучал городское и региональное планирование. Адебайо работал в Tokenhell и CryptoTicker, где писал новости о криптовалютах и финтехе. В настоящее время он является автором новостей для Cryptopolitan.

ОГЛАВЛЕНИЕ

1. Компания DeepSeek представила новый метод рассуждений на основе искусственного интеллекта

2. Разработка модели V3 продолжается

Поделитесь этой статьей