Tech Product

Qwen2.5-VL-7B

Overview

Alibaba Cloud(アリババクラウド)のQwenチームが開発した、高性能なマルチモーダル小規模言語モデルです。Qwen2.5シリーズの視覚理解(Vision-Language)モデルとして、画像認識、文書解析、動画理解において高い性能を発揮します。Fara-7Bのベースモデルとして採用されており、その軽量さと視覚情報の処理能力が、オンデバイスでのコンピュータ操作エージェント実現の基盤となっています。

Mentioned Articles

1 件

External Mentions

5 件