アリババグループホールディングは、競争が激化する世界的なAI戦争で足場を強化し続けるため、最新のマルチモーダルAIモデルであるQwenVLoを発表した。.
このモデル により、ユーザーは テキストプロンプトと視覚的な入力を使用して画像を作成および編集することができ、その機能は OpenAI や DeepSeek などの主要な AI 開発者と同等、あるいは競合することさえ可能になります。
を改良したもの 、Alibabaの以前のQwen2.5-VLベースライン で、テキストから画像への変換や画像から画像への変換といった新しいタスクをサポートするように拡張されています。
際立った特徴の 1 つはプログレッシブ生成です。つまり、ユーザーは画像が構築される様子を見ることができます。これは、今日のほとんどの AI ツールでは珍しいレベルの透明性とインタラクティブ性です。.
「この新しくアップグレードされたモデルは、世界を『理解』するだけでなく、その理解に基づいて高品質の再現も生成します」と同社はブログ投稿で述べた。.
同社は、ユーザーは「かわいい猫の写真を生成して」などのプロンプトを送信して画像を生成したり、猫の写真をアップロードして猫の頭に帽子を付けるなどの編集をリクエストして既存の画像を修正したりできると説明した。.
アリババ、QwenシリーズでAI戦略を強化
AIへの取り組みは、もはやアリババのeコマースにおける優位性を示す単なる見せかけではない。同社は2024年初頭からAIへの積極的な取り組みを進めている。.
2月、アリババのCEOであるエディ・ウー氏は、このeコマースとITの巨大企業が 汎用人工知能 (AGI)の開発を最優先事項とすると述べた。彼は、AGIの開発がアリババの最優先事項になったことを強調し、将来の同社の成長と競争優位性にとってAIの重要性が高まっていることを示した。
AlibabaはすでにQwenブランドで、テキスト、画像、動画、音声といった特定のモダリティに特化した様々なモデルをリリースしています。QwenVLoはこれらのモダリティの組み合わせを置き換え、モバイルや個人用ノートパソコンなどのローエンドマシンで動作するように構築されています。しかし、効率的な動作には依然として大量のクラウドコンピューティングパワーを必要とする最先端のAIモデルとは異なります。.
2025年3月、Quarkは新しいQwen機能を搭載した新しいQuarkアプリをリリースしました。現在、このアプリは検索、要約、クリエイティブツールを備えたAI搭載スマートアシスタントとして機能します。これは、AIモデルを構築し、それを消費者向けエクスペリエンスに組み込むというアリババの意欲を示すものです。.
アリババが AI 競争で DeepSeek と OpenAI に挑戦
アリババによるQwenVLoのリリースは、世界中でAI関連の取り組みが活発化する中、同時に起こりました。米国発のOpenAIは、テキスト、画像、音声を理解し、応答できる、同社史上最も先進的なマルチモーダルモデルGPT-4oをリリースしました。.
中国では、AI開発においてコスト効率が成否を分ける課題になりつつある地元スタートアップ企業DeepSeekに注目が集まっている。同社は、わずか数百万ドルで大規模な競争力のある言語モデルを作成したと主張している。.
中国各地のテクノロジー大手は、より高速で、より安価で、より多用途なAIサービスを次々と投入している。その最初の本格的な参入例の一つがアリババのQwen Vloだ。高品質かつ軽量なマルチモーダル機能を提供することで、欧米と中国の競合企業の両方に対抗できる可能性を秘めている。.
競争は今や、誰が最もスマートなモデルを構築できるかではなく、誰がそのインテリジェンスを大規模に利用できるようにできるかという点に集中しています。.
アリババは、dent、デザイナー、ビジネスオーナー、開発者など、毎日アプリを使用するタイプの人々が、迅速で使いやすく、さまざまなデバイスに最適化されたツールに集まるだろうと確信しています。.
しかし、Qwen VLoが有名企業が市場ユーザーを独占するようなものになるかどうかはまだ分からない。しかし、アリババは次のようなメッセージを強調している。中国はAI覇権争いにおいて世界と歩調を合わせているだけでなく、世界をリードする決意を持っているのだ。.

