Google AIモードに画像認識機能が追加:Lensのマルチモーダル検索が統合される
Googleは、検索の実験的機能「AIモード」にGoogle Lensのマルチモーダル機能を統合したことを発表した。この機能強化により、ユーザーは画像をアップロードして複雑な質問を投げかけ、文脈に沿った詳細な回答を得るこ […]
Enter で検索 · Esc で閉じる
AD
Googleは、検索の実験的機能「AIモード」にGoogle Lensのマルチモーダル機能を統合したことを発表した。この機能強化により、ユーザーは画像をアップロードして複雑な質問を投げかけ、文脈に沿った詳細な回答を得るこ […]
Metaが最新の大規模言語モデル(LLM)ファミリー「Llama 4」を発表した。Llama 4は、ネイティブなマルチモーダル機能、効率的なMixture-of-Experts (MoE) アーキテクチャ、そして最大10 […]
OpenAIが3月26日に発表したChatGPTの新しい画像生成機能が、驚異的な性能と精度で注目を集めている。GPT-4oモデルに直接統合されたこの新機能は、DALL-E 3を上回る画像生成能力を持ち、特にテキスト描写の […]
Googleは、同社が「最もインテリジェント」と位置づける最新AIモデル「Gemini 2.5 Pro」を発表した。このモデルは、応答前に内部で「思考」する能力を備え、複雑なタスクにおける推論やコーディング性能を大幅に向 […]
フランスのAIスタートアップMistral AIが、わずか24B(240億)パラメータながらGoogle GemmaやOpenAIのGPT-4o miniを上回る性能を持つ新モデル「Mistral Small 3.1」を […]
先週アクセス拡大されたGoogleの新AI「Gemini 2.0 Flash」が、ShutterstockやGetty Imagesなどの有料ストック画像から透かし(ウォーターマーク)を容易に除去できることがSNS上で発 […]
Googleは、AIモデル「Gemini 2.0 Flash」にネイティブ画像生成機能を追加し、Google AI StudioとGemini APIを通じて開発者向けに一般公開した。同機能は2024年12月に発表された […]
Googleは12月12日、次世代AIモデル「Gemini 2.0」を発表した。画像と音声の生成機能を新たに搭載し、複数のツールを連携させた自律的なタスク実行を可能にした新モデルは、AIの活用領域を大きく広げる可能性を秘 […]
Amazonが新たなマルチモーダルAI言語モデル「Olympus」の開発を進めており、来週にも公開される可能性が高いことが明らかになった。The Informationの報道によると、このモデルは画像や動画、テキストを処 […]
オープンソースAIプラットフォームのプロバイダーであるH2O.aiが、文書分析と光学文字認識(OCR)タスクを改善するための2つの新しいビジョン言語モデルを発表した。 H2OVL Mississippi-2BとH2OVL […]
Metaが最新の言語モデル「Llama 3.2」を発表した。この新バージョンは、スマートフォンで動作する小型モデルと画像理解能力を持つ大規模モデルを含み、AIの可能性を大きく広げる革新的な機能を搭載している。Llama […]
Allen Institute for Artificial Intelligence(AI2)が、GPT-4を凌ぐ性能を持つオープンソースのマルチモーダルAIモデル「Molmo」を発表した。この革新的なモデルは、テキス […]
AD