政府文書からニュース報道、商取引、音楽、社会的交流に至るまで、世界の多くの情報が現在オンラインで提供されている。そして、1998年に「世界の情報を整理し、普遍的にアクセス可能で有用にする」という使命を持って設立されたGoogleは、この知識と文化の洪水にアクセスする手段となっている。
2024年4月、Googleの検索エンジンはカナダの検索市場で90%のシェアを占めていた。学者にとって、Google ScholarとGoogle Booksは研究生活の主要な支えとなっている。
しかし、Google検索は重要なインフラである一方で、Google自身が社会的に有害な方法でそれを無謀に妨害しており、強力な規制対応が必要とされている。
検索の再構築
5月14日、Googleは「検索の再構築」を目指し、生成AIコンテンツの中央集約場所を含むようにコア検索Webサイトを刷新すると発表した。その最初の展開の一つであるAI による概要は、大規模言語モデル(LLM)を使用して質問に対する権威ある回答を生成するチャットボットであり、ユーザーが他のWebサイトに移動する必要がなくなることを目指している。
OpenAIのChatGPTの2022年11月のリリースは、生成AIの狂乱を引き起こした。しかし、現時点でほとんどのユーザーは、LLM駆動のチャットボットが情報源として信頼できないことを認識しているはずである。これは、これらが単なる高性能なパターン認識機械に過ぎないからである。クエリに対する出力は、データベース内の類似した画像やフレーズに現れる可能性に基づいて各単語や画像の部分が選択される確率を介して生成される。
明確にするために、LLMは知能の一形態、人工であれその他であれではない。彼らは「推論」することができない。LLMにとって、唯一の真実はデータベース内の内容の相関関係の真実である。
これが理由で、GoogleがAIによる概要機能でユーザーに「ピザのチーズが滑らないようにするために約1/8カップの無害な接着剤をピザソースに加える」、「地質学者は毎日一つの小さな石を食べることを推奨している」、「Kで始まるアフリカの国は存在しない」と教えているなどの報告が出たときに非常に面白く、完全に予測可能であった。
これらは誤情報を報告する意味での「エラー」ではなかった。AIによる概要は常にLLMが行うこと、すなわちデータベース内の統計的に確率の高いテキストや画像のリンクを報告していただけである。彼らは真偽を評価することができない。
この広範な嘲笑の後、Googleは最終的に批判を認めた。改善に取り組むと主張しているが、LLMの本質が統計的機械であるため、Wiredが言うように「AIによる概要機能は常に壊れている」可能性が高い。
これらの話は面白いが、Googleの反応にもかかわらず、公共図書館に依存していたサービス、すなわち世界の情報を整理し、アクセス可能にするというサービスを一企業に依存していることについての不安をも引き起こしている。
劇的な影響
Google検索に根本的に組み込まれている2つの欠陥が、影響が劇的になるにつれて無視しがたくなってきている。
第一に、Googleの広告収入依存が、ユーザーに有料広告を提供するために検索機能を妥協させる結果となっている。観察者たちは長い間、Googleが広告を優先することで検索がユーザーにとって悪化していると指摘してきた。なぜなら、広告主とGoogleの利益を優先しているからである。
この広告重点主義は、(広告駆動の)知識エコシステム全体に波及効果をもたらしており、Googleが広告収入を争うメディア企業と直接競争することを意味している。メディア企業は、読者が見つけやすくするためにGoogle検索に依存している。
この競合は、GoogleやMetaがカナダのニュースメディア組織と交渉して支払いを行うことを要求するカナダ連邦政府の物議を醸したオンラインニュース法の中心的な正当化であった。この競合はさらに悪化するであろう。AI Overviewのような製品は、ユーザーが基になるウェブサイトにクリックすることなく、Google上でより多くの時間を費やすことを明らかに意図しているからである。
もう一つあまり認識されていないのは、Googleの知識に対するアプローチ自体が検索結果の正確性や真実性を無視する無謀な行動を引き起こしていることである。Googleとシリコンバレーの多くは、オランダのメディア学者José van Dijckが「データ主義」と呼ぶイデオロギーを信奉している。これはデータがそれ自体を語り、外部の文脈に関係なく解釈できるという信念である。
私と共同著者のNatasha Tusikovが『The New Knowledge: Information, Data and the Remaking of Global Power』で探求しているように、データ主義者にとって、相関関係は真実に等しい。これは、妥当性(何かが真実であるとどう知るのか?)および信頼性(結果を再現できるか?)という基本的な科学的な方法論の基準を無視する反科学的な世界観である。
相関関係が真実であるという考えは、Googleの検索アルゴリズムの中心にある。単純に言えば、検索結果は客観的ではない。Google検索は、リンクされているページの数とどれだけ人気があるかによって(有料ではない)結果をランク付けする。図書館員が本を選び、カードカタログで分類する際に用いる専門的判断とは非常に異なる人気投票であることに注意が必要である。
知識へのアクセス
知識を整理するプロセスが腐敗しているために依存せざるを得ないという社会的な損害は、過小評価することが難しい。健全な知識へのアクセスは社会のあらゆる部分に不可欠である。Googleの広告依存とデータ主義のイデオロギーは、我々の知識エコシステムを積極的に妨害する点にまで達している。
この妨害には厳しい規制対応が必要である。端的に言えば、Google検索は技術者ではなく、図書館員の倫理を持った人々によって運営されるべきである。
そのためには、政府が検索結果の質を確保するための最低限の受け入れ可能な基準を設ける必要がある。これらの基準には、広告と検索結果のリンクの禁止や、個別広告を強化するための検索データの使用の禁止が含まれるべきである。
さらに、検索企業およびすべてのグローバルプラットフォームは、国境を越えて相互運用可能でありながら、国内の民主的な監視下に置かれる必要がある。同様の志を持つ民主主義国との協調が求められる。
これらの措置は容易ではない。しかし、世界の情報の整理を無謀で利益重視の企業に委ね続け、石を食べることが健康的であると人々に教える製品をリリースすることに問題を感じない状況を続けるのであれば、Googleを制御する以外に選択肢はない。
コメント