Tag

マルチモーダルモデル

テクノロジーサイエンス

全 30 件 / 3 ページ

テクノロジー
Google AIモードに画像認識機能が追加：Lensのマルチモーダル検索が統合される

Googleは、検索の実験的機能「AIモード」にGoogle Lensのマルチモーダル機能を統合したことを発表した。この機能強化により、ユーザーは画像をアップロードして複雑な質問を投げかけ、文脈に沿った詳細な回答を得るこ […]

2025年4月8日 7 分で読める
テクノロジー
Meta、次世代AI「Llama 4」シリーズ発表 – 業界最長コンテキスト対応と高性能マルチモーダルAIの全容

Metaが最新の大規模言語モデル（LLM）ファミリー「Llama 4」を発表した。Llama 4は、ネイティブなマルチモーダル機能、効率的なMixture-of-Experts (MoE) アーキテクチャ、そして最大10 […]

2025年4月5日 15 分で読める
テクノロジー
ChatGPTの新たな画像生成機能が驚異的性能で話題沸騰、無料ユーザーへの提供は延期へ

OpenAIが3月26日に発表したChatGPTの新しい画像生成機能が、驚異的な性能と精度で注目を集めている。GPT-4oモデルに直接統合されたこの新機能は、DALL-E 3を上回る画像生成能力を持ち、特にテキスト描写の […]

2025年3月26日 7 分で読める
テクノロジー
Google、最新AI「Gemini 2.5 Pro」発表 – 推論能力強化モデルがベンチマークで競合を凌駕

Googleは、同社が「最もインテリジェント」と位置づける最新AIモデル「Gemini 2.5 Pro」を発表した。このモデルは、応答前に内部で「思考」する能力を備え、複雑なタスクにおける推論やコーディング性能を大幅に向 […]

2025年3月25日 8 分で読める
テクノロジー
Mistral AI、GPT-4o miniを凌駕する小型AIモデル「Small 3.1」を公開

フランスのAIスタートアップMistral AIが、わずか24B（240億）パラメータながらGoogle GemmaやOpenAIのGPT-4o miniを上回る性能を持つ新モデル「Mistral Small 3.1」を […]

2025年3月18日 6 分で読める
テクノロジー
GoogleのAI「Gemini 2.0」が画像の透かし除去を可能に、ストック画像業界に懸念広がる

先週アクセス拡大されたGoogleの新AI「Gemini 2.0 Flash」が、ShutterstockやGetty Imagesなどの有料ストック画像から透かし（ウォーターマーク）を容易に除去できることがSNS上で発 […]

2025年3月16日 4 分で読める
テクノロジー
Google Gemini 2.0、画期的なネイティブ画像生成機能を一般公開

Googleは、AIモデル「Gemini 2.0 Flash」にネイティブ画像生成機能を追加し、Google AI StudioとGemini APIを通じて開発者向けに一般公開した。同機能は2024年12月に発表された […]

2025年3月13日 9 分で読める
テクノロジー
Google、最新フラッグシップAI「Gemini 2.0」を発表 – AIエージェント時代に向けた新たなマルチモーダルモデル

Googleは12月12日、次世代AIモデル「Gemini 2.0」を発表した。画像と音声の生成機能を新たに搭載し、複数のツールを連携させた自律的なタスク実行を可能にした新モデルは、AIの活用領域を大きく広げる可能性を秘 […]

2024年12月11日 6 分で読める
テクノロジー
Amazonが独自マルチモーダルAIモデル「Olympus」を開発、AWS re:Inventで発表か

Amazonが新たなマルチモーダルAI言語モデル「Olympus」の開発を進めており、来週にも公開される可能性が高いことが明らかになった。The Informationの報道によると、このモデルは画像や動画、テキストを処 […]

2024年11月29日 5 分で読める
テクノロジー
H2O.aiの小型モデルが巨人を凌駕 – ドキュメントAIの効率化に挑む

オープンソースAIプラットフォームのプロバイダーであるH2O.aiが、文書分析と光学文字認識（OCR）タスクを改善するための2つの新しいビジョン言語モデルを発表した。 H2OVL Mississippi-2BとH2OVL […]

2024年10月18日 9 分で読める
テクノロジー
Metaが新たにLlama 3.2をリリース：スマートフォン対応とビジョン機能を追加

Metaが最新の言語モデル「Llama 3.2」を発表した。この新バージョンは、スマートフォンで動作する小型モデルと画像理解能力を持つ大規模モデルを含み、AIの可能性を大きく広げる革新的な機能を搭載している。Llama […]

2024年9月27日 8 分で読める
テクノロジー
GPT-4oを凌ぐオープンソースAIモデル「Molmo」が登場

Allen Institute for Artificial Intelligence（AI2）が、GPT-4を凌ぐ性能を持つオープンソースのマルチモーダルAIモデル「Molmo」を発表した。この革新的なモデルは、テキス […]

2024年9月27日 5 分で読める

マルチモーダルモデル

Google AIモードに画像認識機能が追加：Lensのマルチモーダル検索が統合される

Meta、次世代AI「Llama 4」シリーズ発表 &#8211; 業界最長コンテキスト対応と高性能マルチモーダルAIの全容

ChatGPTの新たな画像生成機能が驚異的性能で話題沸騰、無料ユーザーへの提供は延期へ

Google、最新AI「Gemini 2.5 Pro」発表 &#8211; 推論能力強化モデルがベンチマークで競合を凌駕

Mistral AI、GPT-4o miniを凌駕する小型AIモデル「Small 3.1」を公開

GoogleのAI「Gemini 2.0」が画像の透かし除去を可能に、ストック画像業界に懸念広がる

Google Gemini 2.0、画期的なネイティブ画像生成機能を一般公開

Google、最新フラッグシップAI「Gemini 2.0」を発表 &#8211; AIエージェント時代に向けた新たなマルチモーダルモデル

Amazonが独自マルチモーダルAIモデル「Olympus」を開発、AWS re:Inventで発表か

H2O.aiの小型モデルが巨人を凌駕 &#8211; ドキュメントAIの効率化に挑む

Metaが新たにLlama 3.2をリリース：スマートフォン対応とビジョン機能を追加

GPT-4oを凌ぐオープンソースAIモデル「Molmo」が登場

Meta、次世代AI「Llama 4」シリーズ発表 – 業界最長コンテキスト対応と高性能マルチモーダルAIの全容

Google、最新AI「Gemini 2.5 Pro」発表 – 推論能力強化モデルがベンチマークで競合を凌駕

Google、最新フラッグシップAI「Gemini 2.0」を発表 – AIエージェント時代に向けた新たなマルチモーダルモデル

H2O.aiの小型モデルが巨人を凌駕 – ドキュメントAIの効率化に挑む