Appleの音声アシスタントSiriの抜本的な改革が遅れている背景には、長年にわたるリーダーシップの問題と組織内の深刻な対立があったことが、The Informationの調査報道により明らかになった。本記事では、その報道に基づき、Siri開発の迷走、WWDCでの未完成デモの真相、そしてソフトウェアエンジニアリング担当上級副社長Craig Federighi氏主導による外部AIモデル利用解禁という、AppleのAI戦略における大きな転換点の舞台裏を詳述する。
迷走したSiri開発:リーダーシップ不在と組織の壁
Siriの現代化が難航した根本的な原因は、技術的な課題以上に、リーダーシップの欠如と組織間の機能不全にあったようだ。複数の元Apple従業員の証言から、その深刻な状況が浮かび上がってくる。
“ホットポテト”と化したSiri
長年、SiriはApple社内で「hot potato(厄介な問題)」として扱われ、様々なチーム間を転々としてきたという。これは、Siri開発に対する明確なオーナーシップと長期的なビジョンが欠如していたことを示すものと言えるだろう。元従業員らは、特にJohn Giannandrea氏が率いるAI/ML(人工知能/機械学習)グループのリーダーシップに問題があったと指摘している。
Giannandrea氏は2018年にGoogleから鳴り物入りで移籍し、AI分野のトップとしてSiriの再建を期待された。彼はGoogleでの経験に基づき、より良いトレーニングデータ収集やWebスクレイピングによる回答精度向上を目指した。しかし、Siriチームのリーダーシップ刷新を促す声には耳を貸さなかったと報じられている。
Giannandrea氏とWalker氏への批判
特に、Giannandrea氏の下でSiri開発を率いたRobby Walker氏に対しては、厳しい評価が下されている。「野心がなく、将来のSiri設計に対するリスクを取る意欲に欠けていた」と複数の元従業員が証言している。
Walker氏のリーダーシップ下では、応答時間の短縮といった小さな改善は評価される一方で、より本質的な機能向上への取り組みは後回しにされたという。例えば、「Hey Siri」から「Hey」を削除するプロジェクトに2年以上を費やしたが、最終的には実用的メリットが乏しいにもかかわらず、膨大なリソースが投入されたことが批判されている。
さらに、2023年には、ユーザーが苦痛を感じているかどうかを検知するなど、大規模言語モデル(LLM: Large Language Model。大量のテキストデータで学習し、人間のような自然な文章を生成・理解できるAI)を用いてSiriに感情的な知性を持たせるというチームの提案を、「次のSiriリリースに集中したい」として却下したとされる。このチームは結局、Walker氏に内緒でソフトウェアエンジニアリンググループの安全・位置情報チームを通じてプロジェクトを進めたという。
“AIMLess”と呼ばれたAIチーム
こうした状況から、AI/MLグループは社内で「AIMLess」(目標がない、目的がない)という不名誉なあだ名で呼ばれることさえあったという。これは、AI/MLグループの文化が比較的緩慢で、実行力に問題があると多くの従業員が認識していたことを示している。
SEチームとの深刻な対立
Siri開発の停滞は、Giannandrea氏率いるAI/MLチームと、Craig Federighi氏率いるソフトウェアエンジニアリング(SE)チームとの間の機能不全な関係によって、さらに悪化した。両リーダーの管理スタイルの違いに加え、給与、昇進のスピード、休暇期間の違いなどを巡って、チーム間には恨みも蓄積していたという。
最終的に、Federighi氏率いるSEチームは、AI/MLチームとは別に、数百人規模の機械学習エンジニアを集め、「Intelligent Systems」と呼ばれる独自のAI開発部隊を結成するに至った。このチームは、Siriを使わずにアプリを音声制御するデモを開発するなど、AI/MLチームから見れば領域侵犯とも取れる活動も行っていた。Apple Vision Proのアプリ音声制御システムの開発においても、Walker氏と他のメンバーとの間の敵対関係やSiriグループの対応の遅さが、再び大きな摩擦を生んだとされる。
2022年末にChatGPTが登場した際も、AI/MLチームの反応は鈍かった一方で、SEチームは強い関心を示し、Federighi氏にその可能性を示すデモを提示していたという。
WWDCデモの衝撃的な裏側
2023年のWWDC(世界開発者会議)でAppleが披露した、より自然な会話能力を持つとされるSiriのデモも、内部の実態とはかけ離れたものだった可能性が高い。
未完成だったSiri新機能
The Informationの報道によれば、母親のフライト到着時刻と昼食の予定についてSiriに尋ねるデモなど、発表された新機能の多くは、当時、動作するプロトタイプさえ存在しなかったという。Siriチームのメンバーにとっても、このデモは驚きであり、実際にテストデバイスで有効化されていた新機能は、Siri起動時にiPhoneの画面端に表示されるカラフルなリボンのアニメーションだけだった、と元従業員は証言している。
Appleの異例の対応
これは、テストデバイスで動作確認が取れ、マーケティングチームがリリース時期を精査した機能や製品のみを発表してきたAppleの従来の慣行からは、大きく逸脱するものであった。この事実は、AppleがいかにSiriのAI化で苦戦し、外部からのプレッシャーを感じていたかを物語っている。
Federighi主導の新体制と大胆な方針転換
こうした混乱と停滞を経て、AppleはSiri開発体制の抜本的な見直しに踏み切った。Siri開発の監督権はGiannandrea氏からFederighi氏に移され、実際の開発は、Apple社内で実績のあるMike Rockwell氏が率いることになった。
期待される新リーダーシップ
Federighi氏とRockwell氏に対しては、社内から大きな期待が寄せられている。Federighi氏は技術的な詳細に精通し、SEチームを率いて多くの成功を収めてきた実績がある。Rockwell氏もまた、Walker氏に欠けていたとされるビジョンを持つリーダーとして評価されている。SEチーム傘下の「Intelligent Systems」チームが、Apple Intelligence機能の多くを実現したと見られていることも、新体制への期待を高めている。
最大の転換点:外部LLM利用の解禁
そして、Federighi氏のリーダーシップの下で、最も注目すべき変化が訪れた。それは、Siri機能の開発において、サードパーティ製、特にオープンソースのLLMの使用をエンジニアに許可したことである。
これは、Appleの従来の方針からの大きな転換を意味する。以前は、Appleのエンジニアは自社開発のAIモデルしか製品に組み込むことが許されていなかった。サードパーティ製モデルは、あくまで自社モデルと比較するためのベンチマークとしてのみ使用が許可されていた。しかし、多くのエンジニアは、自社モデルがOpenAIなどの外部モデルに比べて性能が劣ると感じており、フラストレーションが溜まっていたという。
自前主義からの脱却とその意味
Federighi氏によるこの方針転換は、最高のAI機能を提供するためには手段を選ばないという、よりプラグマティックなアプローチへの移行を示唆している。Appleの「ユーザープライバシーへの厳格な姿勢」と「自前主義」がAI開発の足枷になっていた側面があったとすれば、この転換はSiriの性能向上にとって大きな前進となる可能性がある。ユーザーにとっては、基盤技術が何であれ、より高性能で便利なSiriが利用できるようになることが最も重要である。
今後の展望:Siriは生まれ変われるか
新しいリーダーシップと開発方針の下で、Siriは長年の停滞から脱却し、競合するAIアシスタントに追いつき、追い越すことができるだろうか。
ユーザーにとってのメリット
外部の高性能なLLMを活用できるようになれば、Siriの会話能力、文脈理解力、タスク実行能力は飛躍的に向上する可能性がある。より自然で、パーソナルで、本当に役立つアシスタントへと進化することが期待される。iOS 18.1や18.2で提供された新機能は、その第一歩と言えるかもしれない。
残された課題とAppleのAI戦略
とはいえ、課題も残る。Giannandrea氏のAI/MLチームは存続しており、Federighi氏のチームとの間で今後も衝突が起こる可能性は否定できない。また、サードパーティ製LLMの利用は、プライバシーやセキュリティに関する新たな課題も生む可能性がある。Appleがこれらの課題にどう対処し、自社開発モデルと外部モデルをどのように組み合わせていくのか、そのAI戦略全体が注目される。
今回のSiri改革の舞台裏は、巨大テクノロジー企業であっても、リーダーシップや組織文化の問題がイノベーションを停滞させうることを示す教訓的な事例と言えるだろう。Federighi氏主導の新体制が、Siriを真にインテリジェントなアシスタントへと生まれ変わらせることができるのか?6月のWWDCに注目したいところだ。
Source
- The Information: How Apple Fumbled Siri’s AI Makeover