フランスのAIスタートアップMistral AIは、同社のチャットボット「Le Chat」に画像生成やウェブ検索などの新機能を追加する大規模なアップデートを実施した。同時に、新しい大規模マルチモーダルモデル「Pixtral Large」も発表し、OpenAIのChatGPTに対する本格的な競争姿勢を鮮明にした。
Pixtral Large:欧州発の強力なマルチモーダルAI

Mistral AIが投入した新しいマルチモーダルモデル「Pixtral Large」は、同社の既存モデル「Mistral Large 2」をベースに開発された124億パラメーターを持つ大規模言語モデルだ。このモデルは、123億パラメーターのマルチモーダルデコーダーと1億パラメーターのビジョンエンコーダーという二層構造で構成されており、テキストと視覚データの両方を高度に処理できる能力を備えている。
性能面では、複数の標準的なベンチマークテストで優れた結果を示している。特に、視覚データを用いた数学的推論を評価するMathVistaベンチマークでは69.4%のスコアを達成し、GPT-4やGemini 1.5 Proを上回る成績を収めた。さらに、複雑なチャートやドキュメントの理解を評価するChartQAとDocVQAでも、競合モデルを凌駕する性能を示している。

また注目すべきは、128,000トークンという広大なコンテキストウィンドウを実現している点だ。これにより、最大30枚の高解像度画像を同時に処理することが可能で、約300ページ相当の書籍を一度に解析できる能力を持つ。また、多言語OCR(光学文字認識)機能も搭載されており、複数言語で書かれた文書や画像内のテキスト解析にも対応している。

Mistral AIは、このモデルを研究用と商用の2つのライセンスで提供している。研究目的での利用はMistral Research License(MRL)の下で可能だが、商用利用には別途ライセンス契約が必要となる。同社のCEOであるArthur Menschは、「最高のAIエクスペリエンスを創造するには、モデルとプロダクトインターフェースを共同設計する必要がある」と述べ、フロントエンド応用を重視した開発アプローチを強調している。
注目すべきは、Meta社の最新モデルLlama 3.1が405億パラメーターを要するのに対し、Pixtral Largeは124億パラメーターという比較的コンパクトなモデルサイズでありながら、競合する大規模モデルと同等以上の性能を実現している点だ。これは、モデルアーキテクチャの効率的な設計と、訓練データの質の高さを示唆している。
さらに、Pixtral Largeは既存のMistral Large 2の優れたテキスト処理能力を維持しながら、マルチモーダル機能を付加することに成功している。この統合的なアプローチにより、ドキュメント解析、チャート理解、自然画像処理など、幅広いユースケースに対応可能な汎用的なAIモデルとして位置づけられている。
Le Chatの進化:総合的なAIアシスタントへ
Le Chatの新機能は以下の5つの主要な領域で大幅な強化が図られた。
まず、Web検索機能の統合により、リアルタイムの情報アクセスが可能になった。検索結果には出典が明示され、信頼性の確保に努めている。
次に、「Canvas」と呼ばれる新しいインターフェースが導入された。これはチャットウィンドウ内で直接ドキュメントの作成や編集が可能な機能で、プレゼンテーション資料やコードの作成にも対応する。
第三に、Pixtral Largeの統合により、複雑なPDF文書や画像の高度な解析が可能になった。グラフ、表、数式などを含む文書全体を理解し、要約や分析を行える。
第四の強化点は、Black Forest Labsとの提携による画像生成機能の追加だ。同社のFlux Proモデルを採用し、チャット内で直接高品質な画像生成が可能になった。
最後に、タスク自動化のための「Agents」機能を実装。領収書のスキャン、会議議事録の要約、請求書処理など、反復的なワークフローを自動化できる。
Xenospectrum’s Take
Mistral AIの今回の動きは、欧州発のAI企業として独自の存在感を示す重要な一手だ。特筆すべきは、124億パラメーターという比較的コンパクトなモデルサイズでありながら、競合他社の大規模モデルと互角以上の性能を実現している点である。
ただし、音声機能の欠如や、企業での採用実績がOpenAIやAnthropicに比べて限定的である点は課題として残る。しかし、EUの地政学的な文脈において、米国AI企業への依存度を下げたい欧州にとって、Mistral AIの存在価値は今後さらに高まる可能性がある。技術力と政治的背景の両面で、同社の動向から目が離せない。
Sources
- Mistal AI:
コメント