2025年10月20日、数百万人が突然、使い慣れたWebサイトやアプリを読み込めなくなったAmazon Web Services(AWS)の障害の際、影響を受けたサーバーは実際にはダウンしていなかった。問題はより根本的なものであった。それらサーバーの名前が見つからなかったのである。

犯人はDNS、すなわちDomain Name Systemにあった。これはインターネットの電話帳とも言える代物である。インターネット上のすべてのデバイスには数値のIPアドレスがあるが、人々はamazon.comやmaps.google.comのような名前を使う。DNSは翻訳者として機能し、それらの名前を正しいIPアドレスに変換することで、デバイスがどこにリクエストを送信すべきかを知ることができる。リンクをクリックしたり、アプリを開いたり、「ログイン」をタップしたりするたびに機能する。モバイルアプリなど、自分で名前を入力しない場合でも、バックグラウンドで名前が使用されている。

DNSの障害がなぜこれほど破壊的になりうるかを理解するには、Domain Name Systemがどのように構築されているかを知ることが役立つ。インターネットには3億7,800万以上の登録ドメイン名が含まれており、単一のグローバル電話帳には多すぎる。すべてのアメリカ人の名前と電話番号を含む単一の本を想像してみよう。そのため、DNSは意図的に分散化されるように設計された。

google.comなどのドメインを所有する各組織は、自身のDNSサーバーで独自のDNSエントリを維持する責任がある。デバイスがIPアドレスを見つける必要がある場合、DNSサーバーに尋ね、そのサーバーが他のサーバーに尋ねることもあり、答えを知っているサーバーが見つかるまで続く。単一のシステムがすべてを保持する必要はない。それがDNSを回復力のあるものにしているのである。

以下が舞台裏でDNSがどのように機能するかだ。

AD

集中化は脆弱性に等しい

では、世界最大のクラウドプロバイダーであるAWSが、ZoomからVenmoそしてスマートベッドに至るまで、なぜ多くの人々にとってインターネットを破壊することができたのだろうか?

クラウドプロバイダーはWebサーバーをホストするだけでなく、DNSを含む重要なインフラストラクチャサービスもホストする。企業がクラウドサーバーをレンタルする場合、クラウドプロバイダーにDNSも管理させることが多い。それは効率的である。クラウドプロバイダーのDNS自体に問題が発生するまでは。

Amazonは、最近の障害の具体的な原因が、AWS DNS管理システムを管理するソフトウェアのタイミングバグであったことを明らかにした。原因が何であれ、効果は明白であった。AWS管理のDNSに依存しているWebサイトやサービスは、そのサーバーが完全に健全であっても、到達できなかった。このように、クラウドはリスクを集中させる。

これはDNSが障害点となった最初の事例ではなかった。2002年、攻撃者はルートDNSサーバー、すなわち他のすべてのDNSサーバーの場所を格納するシステムに対してサービス拒否攻撃を開始し、DNSシステム全体を無効化しようとした。サービス拒否攻撃では、攻撃者はサーバーを圧倒するためにトラフィックの洪水を送る。13台のルートサーバーのうち5台がオフラインになったが、システムは生き残った。

2016年、企業が代理でDNSを実行するために料金を支払っていた主要なDNSプロバイダーであるDynが、大規模な分散型サービス拒否攻撃を受けた。分散型サービス拒否攻撃では、攻撃者は多数のコンピューターを乗っ取り、それらを使用してターゲットにトラフィックの洪水を送る。Dyn攻撃では、数万台の侵害されたデバイスがそのサーバーに殺到し、圧倒した。数時間にわたり、Twitter、PayPal、Netflix、Redditなどの主要サイトは、サーバーが完全に稼働していたにもかかわらず、機能的にオフラインであった。またしても、問題はWebサイトではなく、それらを見つけることができないことであった。

教訓は、DNSが弱いということではなく、少数のプロバイダーへの依存が目に見えない単一障害点を生み出すということである。DNSは当初、分散化のために設計された。しかし、経済的な利便性、クラウドサービス、そしてサービスとしてのDNSが、静かにインターネットを集中化に向けて導いている。

回復力よりも利便性

これらの障害は、ショッピングやストリーミングをはるかに超えて重要である。DNSは、人々が銀行、選挙報告システム、緊急警報プラットフォーム、そして現在重要な意思決定を支えている人工知能ツールに到達する方法でもある。完全にダウンする必要さえない。DNSを遅延させたり、誤った方向に導いたりするだけで、ユーザーとサービス間の認証を破壊し、トランザクションをブロックし、または敏感な瞬間に公衆の信頼を侵食する可能性がある。

不快な現実は、利便性が静かに回復力に勝っているということである。組織が同じ少数のクラウドプロバイダーにDNSとホスティングをますますアウトソーシングするにつれて、彼らは回復力の負債と呼べるものを蓄積している。それは、支払期限が来る瞬間まで目に見えない。インターネットは部分的な障害を乗り越えるように設計されたが、現代の経済学は、その原設計者が明示的に避けようとした方法でリスクを集中させている。

AWS障害からの教訓は、単に1つのソフトウェアバグを修正することだけではない。それは、DNSが重要なインフラストラクチャであることを思い出させるものである。つまり、テクノロジー企業はDNSをバックグラウンドの配管として扱う余裕はなく、回復力は意図的に設計される必要がある。

個々のDNS障害は人々に不便をもたらすが、全体としてのDNSの信頼性は、インターネットがまだ機能するかどうかを定義するものである。


本記事は、アイオワ州立大学 電気・コンピュータ工学科 教授 Doug Jacobson氏によって執筆され、The Conversationに掲載された記事「What is DNS? A computer engineer explains this foundational piece of the web – and why it’s the internet’s Achilles’ heel」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。