Китайская компания, занимающаяся разработкой искусственного интеллекта, добавила функцию распознавания изображений и видео в свой основной чат-бот.
В то же время местные производители микросхем показали, что теперь они могут обеспечить такую же быструю поддержку запуска новых продуктов, которая раньше была сильной стороной Америки.
Компания DeepSeek из Ханчжоу незаметно добавила в свою чат-платформу новую функцию под названием «режим распознавания изображений». Этот новый режим дополняет два других режима, запущенных компанией ранее в этом месяце: «экспертный» и «флэш»
Новая функция позволяет чат-боту понимать не только текст, но и фотографии и видео.
Это ставит его в один ряд с другими крупными чат-ботами на основе искусственного интеллекта, которые уже некоторое время предлагают аналогичные возможности.
Чэнь Сяокан, возглавляющий команду DeepSeek по мультимодальному анализу, заявил, что инструмент был впервые протестирован на небольшой группе пользователей как на веб-сайте, так и в мобильном приложении.
Чен Дели, старший научный сотрудник компании, отметил запуск коротким сообщением , в котором упоминался логотип компании: «Теперь маленький кит может видеть».
Функция отображения изображений и видео появилась всего через несколько дней после того, как DeepSeek выпустила предварительную версию своей новейшей флагманской модели DeepSeek-V4 и предоставила возможность любому желающему скачать и использовать данные о весах модели.
V4 — это не одна, а две модели. Первая, DeepSeek-V4-Pro, имеет 1,6 триллиона параметров и предназначена для сложных задач, требующих комплексного логического мышления и многоэтапных автоматизированных рабочих процессов.
Вторая модель, DeepSeek-V4-Flash, предназначена для обработки большого количества запросов с меньшими затратами. Обе модели поддерживают контекстное окно в один миллион токенов.
Они также используют гибридную архитектуру механизма внимания, которая, по словам компании, снижает вычислительную мощность и объем памяти, необходимые во время выполнения алгоритма.
Китайские производители микросхем достигли нового рубежа
Внимание многих отраслевых наблюдателей привлекло не только само нововведение, но и события, произошедшие в день его запуска.
Четыре китайские компании-производителя чипов — Huawei Ascend, Cambricon, Hygon Information и Moore Threads — подтвердили, что их оборудование безупречно работало с V4 с самого первого дня его выпуска.
Подобная поддержка в тот же день, когда новая модель бесперебойно работает на процессорах сторонних производителей сразу после запуска, а не через недели или месяцы, ранее была практически невозможна за пределами собственной экосистемы Nvidia.
Чипы Huawei Ascend, включая A2, A3 и 950, поддерживают как V4-Pro, так и V4-Flash.
Компания заявила, что ее чип Ascend 950 использует объединенные вычислительные процессы и параллельные потоки обработки для ускорения процесса вывода результатов.
Компания Cambricon завершила адаптацию своей системы с использованием открытого фреймворка для вывода логов vLLM и поделилась своим кодом на GitHub.
Компания Hygon заявила, что провела глубокую оптимизацию модели на своей платформе DCU, чтобы обеспечить плавный переход от выпуска модели к ее фактическому использованию.
Компания Moore Threads совместно с Пекинской академией искусственного интеллекта запустила версию V4 на своей плате MTT S5000, используя программный стек FlagOS.
По мнению экспертов отрасли, этот скоординированный запуск представляет собой реальные перемены.
В течение многих лет чипам, произведенным вне экосистемы Nvidia, требовались месяцы для обеспечения поддержки новой крупной модели. Запуск восьми различных чипсетов, произведенных внутри страны, с первого дня — это значительный шаг вперед.
Общая картина: стоимость и независимость Deepseek
Наблюдатели считают, что более глубокий смысл этого запуска заключается в том, что DeepSeek показала свою способность создавать высокоуровневые системы искусственного интеллекта, не полагаясь на западное оборудование.
Благодаря возможности одновременной работы своих моделей на нескольких китайских чипах, компания снижает риск, связанный с экспортными ограничениями, которые препятствовали доступу китайских компаний к самым мощным американским процессорам.
Стоимость также имеет важное значение. DeepSeek приложил немало усилий, чтобы снизить затраты на запуск своих моделей. Это позволяет компаниям создавать автоматизированные системы, не сталкиваясь с очень высокими вычислительными расходами.
Таким образом, обновления и запуск Deepseek — это не столько один технический прорыв, сколько результат объединения всей цепочки поставок.
Судя по этому релизу, вопрос о том, кто лидирует в области ИИ, смещается от вопроса о том, кто создаст самую умную модель, к вопросу о том, кто сможет поддерживать всю систему в рабочем состоянии дешево иdentв долгосрочной перспективе.

