Appleの次期OS、macOS Sequoia 15.1ベータ版に隠されていたJSONファイルが発見され、同社の新しいAI機能「Apple Intelligence」の内部動作を制御するプロンプトの詳細が明らかになった。これらのプロンプトは、AIの出力を精密に制御し、有害な内容や誤った情報の生成を防ぐ重要な役割を果たすものだが、その効果については疑問も提示されている。
Apple Intelligenceの安全性に配慮したプロンプト設計
Apple Intelligenceは、メール、写真、メッセージなど、さまざまなアプリケーションにAI機能を提供する。各機能には専用のプロンプトが用意されており、これらのプロンプトはAIモデルに対して具体的な指示を与え、ユーザーの期待に沿った適切な応答を生成することを目的としている。
例えば、Apple Mailの「スマート返信」機能に関するプロンプトでは、AIに対して「あなたは、与えられたメールから関連する質問を特定し、短い返信スニペットを提供する役立つメールアシスタントです」という役割が与えられている。さらに、「返信は50語以内に制限してください。ハルシネーションを起こさないでください。事実に基づかない情報を作り出さないでください」という具体的な制約も設けられている。
このようなプロンプトの設計により、AIは特定のタスクに焦点を当て、不適切な内容や誤った情報の生成を回避することができる。同様のアプローチは他の機能でも採用されており、例えば写真アプリの「Memories」機能では、「宗教的、政治的、有害、暴力的、性的、下品、あるいはネガティブ、悲しい、挑発的な内容を生成しないでください」という明確な指示が含まれている。
これらのプロンプトは、AIの「ハルシネーション(幻覚)」(hallucination)と呼ばれる現象、つまりAIが事実でない情報を自信を持って提示してしまう問題に対処するためとされている。例えば、メールの要約機能では、「メール内の質問に答えないでください」という指示が含まれており、AIが不必要な情報を付け加えることを防いでいる。
また、画像生成機能「Image Playground」(開発中は「Generative Playground」と呼ばれていた)においても、著作権で保護されたコンテンツや不適切な内容の生成を防ぐための複数のチェック機構が組み込まれている。Appleの内部テストツールでは、ユーザーが提供するプロンプトに攻撃的な言葉が含まれている場合、AIが応答を生成することを拒否するという。
これらのプロンプトの発見は、Appleが自社のAI機能の安全性と信頼性に高い優先順位を置いていることを示している。ユーザーの利便性を向上させつつ、潜在的なリスクを最小限に抑えるための慎重なアプローチが見て取れる。
しかし、専門家はこれらのプロンプトだけでは完全にAIの不適切な動作を防ぐことはできないと指摘している。ユーザーが工夫次第でプロンプトを操作し、意図しない結果を引き起こす可能性は依然として残されている。例えば、Microsoftの「Bing Chat」(現在は「Copilot」)の初期版では、ユーザーとの対話によって攻撃的な応答や存在論的な議論に発展してしまうケースがあった。
Apple Intelligenceとその関連機能は、2024年後半に米国英語で利用可能になる予定だ。ただし、EUや中国などの地域では規制上の問題により、導入が遅れる可能性がある。また、これらの機能を利用するには、iPhone 15 ProまたはApple M1チップ以降を搭載したiPadやMacが必要となる。
Sources
コメント