AppleとOpenAIは、これまでOpenAIの生成AI技術をAppleのiOSをはじめとしたOSに統合するための協議を進めていたことが報じられていたが、この度契約が締結されたことがThe Informationによって報じられている。加えて、AppleはOpenAIの生成AI技術を用いて、これまでお世辞にも賢いとは言えなかった音声アシスタント「Siri」を大幅に改良する計画のようだ。
AppleとOpenAIの契約は“長年の目標”だった
The Informationは今回の大型契約について、OpenAIのCEO Sam Altman氏から直接この件について聞いた人物の話としてこれを報じている。
だが、OpenAIは複雑な立場に置かれている。Microsoftからは130億ドルという巨額の投資を受けており、多くの製品開発で協力している。今回のAppleとの契約について、MicrosoftのSatya Nadella CEOはOpenAIとMicrosoftの既存の関係にどのような影響を与えるかを懸念しているという。
Appleの中にも反対者がいる。機械学習責任者であるJohn Giannandrea氏は、大規模言語モデル駆動チャットボットや、それに類似したものがAppleのソフトウェアや製品に登場することに反対しているという。
だがこれは、Altman氏にとって“長年の目標”であり、彼はついにこれを達成したと、The Informationは述べている。
The Informationによると、Altman氏らは、2023年半ばにAppleの機械学習チームの従業員らと面会したという。昨年のWWDCの頃に行われたこの会合の結果は、テスト目的でAppleにOpenAIの内部APIへのアクセスを認めるというものだった。
Appleはこれを機会にSiriを強化し、音声アシスタントがより複雑なクエリに対応できるようにしたようだ。主要なLLMにアクセスすることで、Siriはユーザーコマンドの文脈を理解するなど、印象的な新しいスキルを得たとThe Informationは報じている。Appleは、ChatGPTと同様のチャットボットへの転換を含め、SiriでChatGPTを利用するいくつかの方法を検討しているそうだ。
Siriによって既存アプリの音声操作が簡単に行える可能性
また、Bloombergによれば、改良されたSiriによって、ユーザーは書類や電子メールの送信など、特定のアプリの機能を声で実行できるようになるという。これは、以前も報じられたように、社内で「Project Greymatter」として報じられているプロジェクトの一部と見られる。
このアシスタントは、ユーザーの電話のアクティビティを分析し、自動的にSiriが制御する機能を有効にすることができるようになるようだ。Apple Insiderによる追加情報では、Siriは返信や要約を生成する際に、人物や企業などのエンティティ、カレンダーのイベント、場所、日付などを考慮に入れることができるようになるという。
Bloombergによると、「数百」のコマンドをサポートするが、最初は一度に1つのコマンドしか処理できない。その後、Siriは1回のリクエストで複数のタスクをサポートするようになるという。
当初は、電子メールの送信や削除、Apple Newsで特定のサイトを開く、Webリンクをメールで送信する、記事の要約を求めるなどのコマンドがサポートされる。複数のコマンドが可能になれば、録音した会議を要約し、それを同僚にテキストで送ることができるようになる。「あるいは、iPhoneで写真をトリミングし、それを友人にメールで送ることも理論的には可能だ」とBloombergのMark Gurman氏は述べている。
また、社内で“Greymatter Catch Up”と呼ばれる通知要約機能も同時に開発されているようだ。この機能もSiriと連携しており、ユーザーは仮想アシスタントを通じて最近の通知の概要を要求し、受け取ることができるという。
ただし、これらの機能はすぐには登場しないようだ。新バージョンのSiriはiOS 18には搭載されないが、来年初めのアップデートとしてリリースされる可能性があるという。また、当初はApple独自のアプリでのみ動作するようだ。
これに用いられるAIモデルがどれになるのかは不明だが、今回OpenAIとの契約が締結されたということで、OpenAIのGPT-4o等が利用される可能性が高いだろう。
ちなみにこうしたAppleとOpenAIの両社の提携に懸念を示しているMicrosoftだが、CEOのNadella氏はMicrosoftによるOpenAIへの多額の投資を指摘し、OpenAIの将来的な収益の一部を要求したと言われている。つまり、Appleのプラットフォーム上での生成AIの普及は、Microsoftの利益にも繋がる可能性がありそうだ。
Sources
コメント