MENU

ゼノ・スペクトラム（ゼノスペ）では、最新テクノロジーとそれに関連する科学の話題を毎日配信中です！

マルチモーダルモデル– tag –

テクノロジー

Amazonが独自マルチモーダルAIモデル「Olympus」を開発、AWS re:Inventで発表か

Amazonが新たなマルチモーダルAI言語モデル「Olympus」の開発を進めており、来週にも公開される可能性が高いことが明らかになった。The Informationの報道によると、このモデルは画像や動画、テキストを処理できる高度な機能を備えており、AmazonのAI戦略...

2024年11月29日
テクノロジー

H2O.aiの小型モデルが巨人を凌駕 – ドキュメントAIの効率化に挑む

オープンソースAIプラットフォームのプロバイダーであるH2O.aiが、文書分析と光学文字認識（OCR）タスクを改善するための2つの新しいビジョン言語モデルを発表した。 H2OVL Mississippi-2BとH2OVL-Mississippi-0.8Bと名付けられたこれらのモデルは、主要テ...

2024年10月19日
テクノロジー

Metaが新たにLlama 3.2をリリース：スマートフォン対応とビジョン機能を追加

Metaが最新の言語モデル「Llama 3.2」を発表した。この新バージョンは、スマートフォンで動作する小型モデルと画像理解能力を持つ大規模モデルを含み、AIの可能性を大きく広げる革新的な機能を搭載している。Llama 3.2の登場により、モバイルデバイスでのA...

2024年9月27日
テクノロジー

GPT-4oを凌ぐオープンソースAIモデル「Molmo」が登場

Allen Institute for Artificial Intelligence（AI2）が、GPT-4を凌ぐ性能を持つオープンソースのマルチモーダルAIモデル「Molmo」を発表した。この革新的なモデルは、テキストと画像の両方を処理できる能力を持ち、特に画像認識タスクにおいて卓越した性...

2024年9月27日
テクノロジー

Mistral、画像と文章を処理できる初のマルチモーダルAI「Pixtral 12B」をリリース

フランスのAIスタートアップMistralが、同社初となるマルチモーダルAIモデル「Pixtral 12B」をリリースした。このモデルは、テキストだけでなく画像も処理できる能力を持ち、AIの応用範囲を大きく広げる可能性を秘めている。 Pixtral 12Bの概要と特徴 Pixt...

2024年9月12日
テクノロジー

ノート作成AIアプリ「NotebookLM」に複雑な文書をAI音声で分かりやすく解説する機能が登場

GoogleのAIを活用したノート作成およびリサーチツール「NotebookLM」に、新たに「Audio Overview」（オーディオ概要）機能が追加された。この機能により、ユーザーはアップロードした文書や資料の内容をAI生成の音声対話形式に変換し、まるで“ポッドキャス...

2024年9月12日
テクノロジー

Alibaba、最先端の視覚言語AIモデル「Qwen2-VL」を発表：GPT-4oを凌ぐベンチマーク結果

中国のテクノロジー大手Alibaba Groupの子会社であるAlibaba Cloudは、画期的な視覚言語AIモデル「Qwen2-VL」を発表した。このモデルは、画像や動画の高度な理解能力と多言語での対話能力を備えており、複数のベンチマークテストでOpenAIのGPT-4oやAnthrop...

2024年8月31日
テクノロジー

OpenAI、これまでより60％低価格で高性能なAIモデル「GPT-4o mini」を発表

OpenAIは、低コストでパフォーマンスに優れる新しいマルチモーダルAIモデル「GPT-4o mini」を発表した。GPT-4o miniは、従来のGPT-3.5 Turboに比べて60%低コストでありながら、より高いパフォーマンスを発揮するという。この革新的なモデルは、AIの民主化...

2024年7月19日
テクノロジー

Anthropic、GPT-4oを上回る性能を示す「Claude 3.5 Sonnet」を無料で提供開始

OpenAIのライバル企業Anthropicは、最新かつ最も高度なAIモデル「Claude 3.5 Sonnet」をリリースした。これは、これから順次リリースされる「Claude 3.5」シリーズの最初のモデルであり、前「Claude 3」シリーズの最上位モデル「Claude 3 Opus」を上回る性...

2024年6月21日
テクノロジー

xAI、OpenAIのGPT-4Vを上回ると主張する「Grok-1.5V」マルチモーダルモデルを発表

TeslaのElon Musk氏が創設したAIスタートアップ「xAI」は、同社の目指す“真にインテリジェントなAI”の実現に繋がるとする、同社初のマルチモーダルモデル、「Grok-1.5V（Grok-1.5 Vision）」を発表した。xAIによると、Grok-1.5Vはテキスト理解だけでなく、...

2024年4月13日

1