Google検索で上位に表示されないということはWeb上で存在していないことと同義である程、この検索ランキングシステムで上位に表示される事は特に企業のマーケティング戦略において重要な位置を占め、SEO(Search Engine Optimization:検索エンジン最適化)という1つの産業を生み出すに至っている。
Google自身がこのアルゴリズムを明らかにしておらず、その中身はこれまでブラックボックスであったが、今回意図してか世紀の失敗の結果か、Googleはこの検索ランキングの仕組みを詳しく説明した内部文書を流出させてしまったようだ。
Google検索のブラックボックスの中身が垣間見えるかも知れない
Googleは、同社の「Content API Warehouse」から来たと思われる数千のドキュメントを誤ってオンラインで公開してしまったようだ。
「Google API Content Warehouse」と題された2,500ページにも及ぶドキュメントには、内部APIに関連する情報が含まれており、検索結果に影響を与える要素やコンポーネントが説明されている。これらのドキュメントは、SEO企業のEA Eagle Digitalの創設者であるErfan Azimi氏によって、今月初めにソフトウェア会社SparkToroの共同設立者であるRand Fishkin氏に匿名で送付されていた。
ドキュメントのコミット履歴に基づくと、このコードは 202 年3月27日にGoogleによってGitHubにアップロードされ、注目を集めた後、2024年5月7日に撤回または削除されたようだ。しかし、サードパーティのサービスによってインデックス作成が行われたため、流出したGoogleの文書のコピーはまだ利用可能である。この文書に記載されている情報は、SEOやデジタルマーケティングの分野で活動する人々にとって貴重なものであるが、どのような要素が他の要素よりも重要であるかは共有されていない。検索を促進するために最も重要な要素に関する情報がないため、それを扱う人々にとっては、あらゆる側面が重要である可能性もあれば、全く重要でない可能性もある。
このドキュメントはGoogle検索で上位表示するためのチートコードになり得る可能性があるが、ことは単純ではない。文書全体は全部で2,500ページもあり、古い構成要素もあれば、最近のものと分類できるものもある。これについて、SEO企業iPullRankの創設者兼CEOであるMike King氏が初期レビューでまとめてくれている。ユーザーはこの文書から、Google検索ランキングにおいて、何が有効で何が有効でないのか、検索で上位にランクインするために重要な要素は何かについて、ある程度の示唆を得ることが出来るかも知れない。
概要については以下の通りだ。
- 現在:資料によると、この情報は3月現在のもの。
- ランキングの特徴:2,596のモジュールがAPIドキュメントで14,014の属性で表現されている。
- 重み付け:ドキュメントには、ランキング機能がどのように重み付けされているかは明記されていない。
- Twiddlers:King氏によれば、これらは「文書の情報検索スコアを調整したり、文書のランキングを変更したりする」再ランキング機能である。
- 降格:コンテンツは、以下のようなさまざまな理由で降格することがある:
- リンクがターゲットサイトと一致しない。
- SERPシグナルがユーザーの不満を示す。
- 製品レビュー
- ロケーション
- 完全一致ドメイン
- ポルノ
- 変更履歴:Googleは、これまでインデックスしたすべてのページのすべてのバージョンのコピーを保持しているらしい。つまり、Googleはページに加えられたすべての変更を “記憶”しているのだ。しかし、Googleはリンクを分析する際、URLの直近20回の変更履歴しか使用しない。
興味深いところでは、Googleが否定していたChromeのデータ利用について、やはりこれが利用されていたことが示唆されている。
古典的なランキング要因である PageRank、アンカー (リンクのアンカー テキストに基づくトピック PageRank)、およびテキスト マッチングの重要性が低下していることが確認出来た事だ。だが、ページタイトルは依然として重要であるという。
また、Google自身は否定していた「ドメイン権威性」について、siteAuthorityという記述が確認出来た事からそれが存在している可能性がやはりありそうだ。
ドメインの年齢はやはり評価に関係があり、作られたばかりの新しいサイトはやはりサンドボックスに閉じ込められている可能性があるようだ。
また、SEOで一般的に言われている「Experience(経験)」「Expertise(専門性)」「Authoritativeness(権威性)」「Trustworthiness(信頼性)」はそこまで重要ではない可能性もあるようだ。
ただし、SEO業界で活動する人々は、Googleの発言の中には、例えばドメインオーソリティや、それが検索結果にどのような影響を与えるかなど、文書に記載されていることと矛盾するものもあると主張している。今回流出した文書に対してGoogleは声明を発表していない。Googleは3月に大型の検索アップデートをリリースし、“役に立つ”コンテンツを標準よりも上位に置いている。アルゴリズムは基本的に、Webサイト上の特定のページが検索エンジンに合わせて作られたものなのか、それとも人々に合わせて作られたものなのかを判断し、決定する方法で運用されている。
Sources
- SparkTro: An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them
- iPullrank: Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked
- via Search Engine Land: HUGE Google Search document leak reveals inner workings of ranking algorithm
コメント