テクノロジー
1クリックで50万トークン消費? AIエージェントに社内システムを操作させる「見えないコスト」
企業が生成AIと自律型エージェントをレガシーシステムに統合する際の課題に対し、AWSは仮想デスクトップサービスAmazon WorkSpacesをAIエージェント向けに拡張した。これにより、エージェントがGUI操作を模倣し、既存システムを改修せずに自動化を実現できるが、視覚ベースの操作はトークン消費量が多く、運用コストの課題も残る。
別名: グラフィカル・ユーザー・インターフェース
コンピューターの操作画面において、テキストだけでなく画像やアイコン、ボタンなどの視覚的な要素を用いて、マウスやタッチ操作で直感的に指示を出せる仕組み。
企業が生成AIと自律型エージェントをレガシーシステムに統合する際の課題に対し、AWSは仮想デスクトップサービスAmazon WorkSpacesをAIエージェント向けに拡張した。これにより、エージェントがGUI操作を模倣し、既存システムを改修せずに自動化を実現できるが、視覚ベースの操作はトークン消費量が多く、運用コストの課題も残る。
Metaは、AIエージェントの訓練データ整備のため、米国従業員の業務用PCでマウス移動やクリック、キーストローク、画面スナップショットを収集する。これは、AIを「答えるAI」から「操作するAI」へ進化させるため、完成品ではなく作業途中の「迷い」を高価なデータとして活用する狙いがある。他社が顧客データと学習データを分離する中、Metaは従業員の行動データをAI訓練に直接利用する点で一線を画しており、プライバシーや労務管理上の課題が指摘されている。
Appleが長年抱えてきたAI開発の遅れを取り戻すため、ついに最大のライバルであるGoogleの手を借りる決断を下した。BloombergのMark Gurman記者によると、GoogleのGeminiモデルを統合した「 […]