Tech Product

Fara-7B

Overview

Microsoftが発表した、コンピュータの画面(ピクセル)を直接認識して操作する「Computer Use Agent(CUA)」です。70億パラメータという軽量なサイズながら、Webブラウザ上でのクリック、スクロール、キーボード入力などの複雑なタスクを自律的に実行できます。従来のモデルがHTML構造(DOM)に依存していたのに対し、人間と同様に視覚情報のみで判断する「Pixel-in, Action-out」アプローチを採用しているのが特徴です。これにより、構造が複雑なサイトでも操作が可能で、オンデバイスでの動作に最適化されています。

Mentioned Articles

1 件

External Mentions

3 件