Term

マルチモーダルAI

Overview

テキスト、画像、音声、動画など、異なる種類のデータ（モダリティ）を統合的に処理・理解できるAIモデルを指します。従来のAIがテキストのみ、あるいは画像のみを扱う「シングルモーダル」であったのに対し、マルチモーダルAIは例えば「画像の内容を言葉で説明する」ことや「指示された内容に基づいて画像を生成する」ことが可能です。人間が五感を使って世界を理解するように、より複雑で現実的なコンテキストを理解できる次世代のAI技術として注目されています。

Mentioned Articles

5 件

テクノロジー
中国、旧型カメラ7億台を交換なしでAI化：「反応型」から「予測型」へ変わった監視の中身

中国の公共空間で何百万台ものカメラが稼働していることは広く知られているが、そのカメラに何ができて何ができないかは、思われているより単純ではない。長年にわたって構築された監視網は実のところ「反応型」のシステムだった。すでにウォッチリストに載っている人物が画角に入れば警報を鳴らせるが、それ以外の人物の行動を事前に解析する能力は乏しかった。その前提が今、変わろうとしている。HikvisionとHuaweiのAIカメラ・ソフトウェアによって、中国各地の地方政府は既存の監視インフラを刷新しており、テキストを打ち込むだけで映像を横断検索できる新世代のシステムが現実の運用に入りつつある。

2026年5月28日
テクノロジー
Meta、AIの心臓部に1.5兆円投資か？データ企業Scale AIへの巨額出資が示す「オープン戦略」の岐路

オープンソースAIの旗手を自認してきたMetaが、水面下で巨大な賭けに出ようとしている。AIモデルの性能を根幹から左右する「データ」を生成するスタートアップ、Scale AIに対し、100億ドル（約1.5兆円）を超える可 […]

2025年6月9日
テクノロジー
GitHub Copilotが自律型AIエージェントへと進化：OpenAI Codexに挑む新機能搭載で開発現場の未来はどうなるか

Microsoft傘下のGitHubは、年次開発者会議「Build 2025」の場で、同社のAIペアプログラマー「GitHub Copilot」に、自律的にタスクを処理する「コーディングエージェント」機能を搭載すると発表 […]

2025年5月20日 11 分で読める
テクノロジー
OpenAI元CTOのMira Muratiが設立したThinking Machines Lab、20億ドル調達へ

OpenAIの元CTO、Mira Murati氏が設立した新たなAIスタートアップ「Thinking Machines Lab」が、業界の常識を覆す可能性のある動きを見せている。製品リリース前のシード段階にもかかわらず、 […]

2025年4月12日
テクノロジー
Amazonが独自マルチモーダルAIモデル「Olympus」を開発、AWS re:Inventで発表か

Amazonが新たなマルチモーダルAI言語モデル「Olympus」の開発を進めており、来週にも公開される可能性が高いことが明らかになった。The Informationの報道によると、このモデルは画像や動画、テキストを処 […]

2024年11月29日 5 分で読める

External Mentions

2 件

Reddit AWS user hit with 30000 dollar bill after Claude runaway on Bedrock
▲ 114 petburiraja 2026年5月14日
Hacker News AMC Theatres will screen a Swedish movie 'visually dubbed' with the help of AI
▲ 85 bookofjoe 2025年3月22日

マルチモーダルAI

Overview

Mentioned Articles

中国、旧型カメラ7億台を交換なしでAI化：「反応型」から「予測型」へ変わった監視の中身

Meta、AIの心臓部に1.5兆円投資か？データ企業Scale AIへの巨額出資が示す「オープン戦略」の岐路

GitHub Copilotが自律型AIエージェントへと進化：OpenAI Codexに挑む新機能搭載で開発現場の未来はどうなるか

OpenAI元CTOのMira Muratiが設立したThinking Machines Lab、20億ドル調達へ

Amazonが独自マルチモーダルAIモデル「Olympus」を開発、AWS re:Inventで発表か

External Mentions