Ahrefs 観測値(Ahrefs-observed estimates)をもとに、ChatGPT・Google AI Overviews(AIO)・Google AI Mode(AIM)・organic SERP の 4 検索面を、 日本市場関連ドメイン 150 件に対して同時に観測した観察研究です。本ストーリーでは、その結果を 6 つの場面に分けて辿ります。
AI 検索における「見え方」は、もはやひとつではありません。Google の SERP は依然として大きい一方で、AI Overviews は要約レイヤを差し込み、AI Mode は別の検索経路(retrieval path)で答えを返し、ChatGPT では、応答内に現れる外部参照・リンクの可視性が、Google 系検索面とは異なる形で観測されます。 PRISM は、これら 4 つの検索面(retrieval surfaces)に対して、日本市場関連の同一 150 ドメインを同時に観測することから始まりました。
運用上の閾値(operational threshold)= 10 を境に、各検索面の引用(citation)を substantial(相応に観測)/ near-empty(ほぼ無観測)に分類し、4 軸で IV(個別観測対象)にタグ付けします。これだけで、全 150 ドメインのうち 114 件(76.0%)は 4 検索面すべてで substantial と分類され、残り 24% に明瞭な 7 つのクラスタが立ち上がってきます。
AIO と AIM の両方で引用(citation)> 0 となった IV を切り出すと、その圧倒的多数でAIM の引用数が AIO を上回って観測されました。 中央値比(median ratio)は AIM/AIO = 1.4446。これは PRISM 全体で最も頑健に観測された Tier 1 結果です。
解釈は厳格に統制(controlled)しています。AIM は AIO に対して、より広いパッセージ単位の検索(passage-level retrieval)により多様な IV を引用の俎上に載せる傾向がある — という仮説層 H2 はこの観測の整理用であり、provider 内部メカニズム(provider-internal mechanism)の証明ではありません。
完全に均等な構成サンプル(医療 / EC / SaaS 各 50)から、3 つの命名済みクラスタ(named cluster)の業種構成は、驚くほど偏って立ち上がってきました。 F-1 / F-2 は EC が圧倒し、F-3 は SaaS が圧倒します。消費者向け(consumer)/ B2B が、クラスタ単位で反転しています。
Fisher 正確検定(Fisher exact test)で p ≈ 10⁻⁵、Cohen's h > 1.0。統計的には頑健(statistically robust)ですが、業種割り当ての来歴(assignment provenance)、未測定の交絡変数、日本市場単独 という限定がある以上、本稿では因果的駆動因(causal driver)として断定はしません。Phase B / 3 においてホールドアウト検証(hold-out validation)およびクロスロケールのパイロットを予定しています。
命名済みクラスタ(named cluster)と残余(residual)を一枚の見取り図に並べると、4 つの仮説フィルタ(hypothesis filters)が交差する構造が浮かび上がってきます。 PRISM はこれを 4 層記述統合モデル(4-layer descriptive integration model) と呼びます。各層は駆動因(driver)の主張ではなく、観測されたパターンを整理するための事後的なラベルです。
Knowledge Graph 適合度に応じて AIO 引用の挙動が分岐する観測パターンを整理します。
AIO と比べ、AIM が広いパッセージ単位の検索を通じて多様な IV を引き上げる観測パターンを整理します。
ChatGPT 上で B2B / SaaS 系の IV の引用が相対的に希薄(sparse)になる傾向を整理します。
organic SERP の可視性と AIO / AIM 引用の Ahrefs 観測上の共変動を、運用上識別します。
4 層モデルは 147 IV(n=150 中、6 / 7 クラスタ)を統一的に整理します。残り 1 クラスタ(3 IV / Type R)は本フレームワークの外として明示的に保留されます。
— 駆動因(driver)として解釈してはなりません。フィルタ(filter)は仮説層であり、provider 内部メカニズムではありません。
PRISM は施策効果を保証する処方箋ではありません。しかし Tier 3 の知見として、観測パターンに対応する予備的トリアージ(preliminary triage)を提示できます。 AIO 起点 / AIM 起点 / ChatGPT 起点 / SERP 起点 の 4 類型は、IV 単位でどの検索面を起点に観察を継続すべきかのトリアージ判断に用いられます。
AIO で先行的に引用が立ち上がる IV 群。Knowledge Graph 適合度の継続観測と、要約候補としての構造化を、トリアージの優先項目とします。
AIO ではほぼ無観測(near-empty)であるものの、AIM では substantial に出現する IV 群。AIM のパッセージ検索を起点とした観察継続を優先します。
ChatGPT 上に substantial な引用が観測される一方で、Google 系ではほぼ無観測な IV 群。他経路での三角検証(triangulation)により挙動を検証します。
organic SERP に強い可視性がある一方で、AI 検索面の引用が伴わない IV 群。H4 運用識別子(operational discriminator)の対象です。
本類型はトリアージの予備的枠組み(preliminary framework)であり、改善効果の保証ではありません。Phase B 以降のホールドアウト検証 / 直接サンプリング(direct sampling)/ 複数プロバイダ三角検証(provider triangulation)パイロットによって、各類型の射程と境界を更新していきます。
PRISM は探索的観察研究です。その射程は Ahrefs 観測値(Ahrefs-observed estimates) と n=150 のサンプル内全数照合(within-sample census) の内側にあります。 それを超えて、ユーザー行動・到達数・学習コーパス・施策 ROI などを断定しないことを、明示的に境界として記述します。
本稿は Ahrefs 観測値(Ahrefs-observed estimates)に基づきます。各 platform の実機ユーザー出力(live user output)や実到達リーチ(actual reach)の直接測定ではありません。
n=150 の構成サンプル(constructed sample)内におけるサンプル内全数照合(within-sample census)です。日本市場全ドメインの悉皆調査ではありません。
H1〜H4 のフィルタ(filter)は観測パターンを整理する仮説層であり、provider 内部メカニズム(provider-internal mechanism)の証明ではありません。
施策効果・ROI・改善不能性は本稿単体では断定しません。第三者向けツール内で Ahrefs 由来データ・固有指標・個別値は表示・提供・利用しません。
そして、これらの境界の内側に立つことが、AI 検索時代の可視性(visibility)を誠実に観察するということだ — と
GEO PRISM フレームワーク は考えます。
ストーリー版で辿った 6 つの場面は、論文 Stage C v10.8.3 における主要な知見(R-1 / R-2 / R-3 / P-1 / P-2 / P-3)と 4 層記述統合モデル(4-layer descriptive integration model)の縮約です。詳細な統計、限界、Phase B / 3 計画、再現性アーティファクトについては、版固定 PDF で確認できます。