テクノロジー
Microsoft、オンデバイスAIエージェントを可能にする「Fara-7B」を発表
MicrosoftはAI技術のパラダイムを「対話(Chat)」から「行動(Agency)」へと劇的にシフトさせる実験的なモデル、「Fara-7B」を発表した。 これは単なる「賢いチャットボット」ではない。ユーザーの代わり […]
Microsoftが発表した、コンピュータの画面(ピクセル)を直接認識して操作する「Computer Use Agent(CUA)」です。70億パラメータという軽量なサイズながら、Webブラウザ上でのクリック、スクロール、キーボード入力などの複雑なタスクを自律的に実行できます。従来のモデルがHTML構造(DOM)に依存していたのに対し、人間と同様に視覚情報のみで判断する「Pixel-in, Action-out」アプローチを採用しているのが特徴です。これにより、構造が複雑なサイトでも操作が可能で、オンデバイスでの動作に最適化されています。