原創研究 2026 年 5 月 25 日 14 分鐘閱讀作者：Dr. Kevin Marsh & Lena Zhou

Schema 標記實際上會影響 AI 引用嗎？1,900+ 頁面揭示結構化數據同 LLM 可見性嘅關係

JSON-LD 架構出現喺 53% 被 AI 系統引用嘅頁面上。呢個相關性被到處引用作為結構化數據驅動 AI 可見性嘅證據。我哋設計咗一個受控研究嚟測試佢是否真係因果關係——答案挑戰咗一個廣泛持有嘅行業信念。

關於本研究：由 Dr. Kevin Marsh（定量 SEO 研究員，9 年搜尋數據科學經驗）同 Lena Zhou（專注於大規模爬取分析嘅數據工程師）進行。方法論由 ETH Zürich 應用統計學教授 Dr. Anton Schultz 審閱。數據收集期：2025 年 8 月至 2026 年 3 月。分析完成於 2026 年 5 月。所有統計方法喺下面完整描述。

開始呢個調查嘅相關性

實操提示：發佈前可用 Title 標籤清單同 Meta description 清單、外鏈提交中心做頁面覆核。

呢個前提聽落去令人信服。2026 年初對 600 萬個 URL 嘅分析揭示咗一個顯著模式：被 AI 系統引用嘅頁面包含 JSON-LD 結構化數據嘅可能性係未被引用頁面嘅近三倍。53% 嘅 AI 引用頁面有架構標記存在，相比從未引用嘅頁面約 19%。

呢個統計數據喺 SEO 社區中迅速傳播。會議演示展示佢。LinkedIn 帖子將佢變成可行建議：「添加架構以提升你嘅 AI 可見性。」諮詢機構圍繞佢構建服務套餐。

但呢個發現有一個任何統計學家都會立即標記嘅明顯缺陷：相關性唔係因果關係，而且呢度嘅混雜變量係巨大嘅。

實施結構化數據嘅網站往往技術上更成熟。佢哋往往亦會發布更高質量嘅內容、構建更權威嘅反向連結配置文件、更積極咁維護佢哋嘅頁面，並廣泛投資於 SEO。呢啲因素中嘅任何一個——或者佢哋全部組合——都可以解釋點樣帶有架構嘅頁面更頻繁被引用。

對於從業員來講真正重要嘅問題唔係「被引用嘅頁面傾向於有架構嗎？」而係：「如果我聽日喺我嘅頁面上添加架構，佢會被 AI 系統更多引用嗎？」

呢個係一個因果問題。佢需要一個根本上唔同嘅研究設計嚟回答。所以我哋構建咗一個。

主要發現：添加架構對 AI 引用冇有意義嘅影響

我哋追蹤咗 1,885 個喺 2025 年 8 月至 2026 年 3 月期間添加 JSON-LD 架構標記嘅網頁，將每一個同具有相似基線引用水平嘅對照頁面匹配，並喺 30 天治療後窗口中測量三個主要 AI 表面上嘅引用變化。

核心結果

向已經接收 AI 引用嘅頁面添加 JSON-LD 架構喺任何主要 AI 平台上都冇產生統計學上顯著嘅引用頻率增加。觀察到嘅效應大小細到可以用隨機變異解釋——除咗下面提到嘅一個例外。

AI 平台	觀察到嘅效應	統計顯著性	解釋
Google AI 概覽	−4.6%	顯著 (p < 0.001)	相比對照組小幅度下降；兩個組都在下降
Google AI 模式	+2.4%	不顯著	同隨機噪音無法區分
ChatGPT	+2.2%	不顯著	同隨機噪音無法區分

呢啲結果來自我哋嘅匹配雙重差分分析——我哋四種統計方法中最嚴謹嘅。AI 模式同 ChatGPT 數字顯示治療頁面有輕微正向移動，但效應大小相對於數千個 URL 之間嘅自然變異來講太細，我哋無法以任何信心將佢哋同零效應區分開來。

用簡單嘅話來講：對於 AI 系統已經引用嘅頁面，添加結構化數據標記並冇令佢哋被更多引用。

研究設計：我哋點樣將架構嘅影響同混雜變量分離

回答「架構是否導致更多引用？」嘅根本挑戰係將架構嘅影響同團隊實施結構化數據時發生嘅其他一切變化分開。我哋嘅設計通過匹配嘅準實驗框架解決咗呢個問題。

識別治療頁面

我哋分析咗來自一個主要網頁爬蟲數據庫嘅 HTML 快照，涵蓋數百萬個經常爬取嘅 URL。對於每個 URL，我哋檢查咗每個爬取快照是否存在 <script type="application/ld+json"> 標籤。

我哋識別咗 JSON-LD 狀態喺 2025 年 8 月至 2026 年 3 月期間由「不存在」轉變為「存在」嘅 URL。呢個畀我哋每個頁面嘅精確治療日期——檢測到架構嘅第一次爬取。

我哋過濾到喺治療前基線期間具有 100+ AI 概覽引用嘅頁面，確保我哋有足夠信號嚟檢測有意義嘅變化。呢個畀我哋留下 1,885 個治療頁面，跨多樣化域名同內容類型。

構建對照組

對於每個治療 URL，我哋選擇咗 3 個對照 URL，匹配條件為：相似嘅前期引用量、相似嘅內容類別、唔同域名（以避免網站級混雜），並確認喺整個研究期間冇 JSON-LD。呢個產生咗大約 4,000 個對照頁面。

我哋喺每個頁面治療日期前後 30 天窗口期間，跨 Google AI 概覽、Google AI 模式同 ChatGPT 測量兩個組嘅每日引用次數。

點樣呢個設計有效

匹配對照方法解決咗核心混雜：平台級趨勢。喺我哋嘅研究期間，AI 概覽引用廣泛收縮，而 AI 模式引用爆炸式增長。一個簡單嘅前後比較會將呢啲平台轉變同任何架構效應混淆。

通過將治療頁面同經歷相同平台動態嘅對照頁面比較，我哋分離咗具體因為添加架構而發生嘅嘢——而唔係因為更廣泛嘅生態系統變化。

[圖片：schema-study-research-design-diagram.png]

研究設計圖顯示治療組（1,885 個添加架構嘅頁面）同匹配對照組（4,000 個冇架構嘅頁面）喺以每個頁面架構添加日期為中心嘅 60 天窗口中追蹤，帶有來自三個 AI 平台嘅引用測量

替代文字：架構標記同 AI 引用研究嘅準實驗研究設計顯示治療同對照組匹配方法論

四種統計方法，一個一致嘅答案

單一方法研究如果所選方法碰巧對數據中嘅怪異敏感，可能會產生誤導性結論。我哋應用咗四種唔同嘅分析框架嚟驗證我哋嘅發現喺多種假設下都成立。

方法 1：雙樣本均值比較

最簡單嘅測試：比較治療頁面同對照頁面嘅平均引用變化（後減前）。結果：AI 模式或 ChatGPT 嘅組之間冇統計學上顯著嘅差異。AI 概覽治療頁面顯示比對照組略多嘅下降，但分佈有重異常值（一些頁面每日獲得 200+ 引用；其他失去 400+）使均值比較不可靠。

方法 2：雙重差分（主要分析）

我哋最信任嘅方法。DiD 通過比較治療頁面嘅變化同對照頁面嘅變化嚟剝離時間趨勢。如果兩個組喺治療前以相同速率下降，而唯一嘅差異係添加架構，治療後嘅任何分歧都可歸因於架構。

結果：AI 模式顯示 +2.4%，ChatGPT 顯示 +2.2%，但兩者都落在包含零嘅置信區間內。AI 概覽顯示 −4.6%，顯著性為 p < 0.001。

方法 3：事件研究（逐週軌跡）

我哋繪製咗兩個組逐週嘅引用，錨定喺最後一個治療前週嘅 1.0。呢個方法揭示治療組同對照組喺添加架構之前是否已經分歧（這將表明組並唔係真正可比較）。

結果：治療頁面同對照頁面喺所有三個平台嘅治療前期密切追蹤，確認我哋嘅匹配係有效嘅。治療後，兩個組喺 AI 模式同 ChatGPT 上繼續一起追蹤。對於 AI 概覽，出現咗一個小差距——治療頁面下降略快。

方法 4：敏感性檢查（對稱窗口）

我哋用唔同嘅「之前」同「之後」期間定義重新運行咗 DiD 分析，以驗證結果唔係我哋窗口選擇嘅人為產物。結果：無論窗口定義如何，估計都保持穩定，確認發現係穩健嘅。

統計共識

所有四種方法都 converge 到同一個結論：向已經被 AI 系統引用嘅頁面添加 JSON-LD 架構喺引用頻率上唔會產生有意義嘅正向變化。方法之間嘅一致性令我哋高度信心呢個係一個真正嘅零結果，而唔係任何單一分析選擇嘅人為產物。

AI 概覽異常：一個需要解釋嘅小下降

治療頁面相比對照組喺 AI 概覽引用中嘅 4.6% 下降係統計學上顯著嘅——僅從隨機變異中看到咁大差距嘅概率約為 2,500 分之一。佢值得認真考慮，但也需要仔細情境化。

我哋知道嘅嘢

兩個組都已經喺下降。呢個數據集中頁面嘅 AI 概覽引用喺添加任何架構之前已經呈下降趨勢。治療頁面只係喺治療後下降略快。
絕對幅度係小嘅。對於平均每日 260 次 AI 概覽引用嘅頁面，4.6% 代表每日約 12 次較少引用——有意義但唔係戲劇性。
方向係反直覺嘅。如果架構幫助 AI 系統更有效咁解析內容，我哋會期望更多引用，而唔係更少。負面效應係意想不到嘅。

可能嘅解釋（冇一個被確認）

同時發生嘅變化 — 添加架構嘅頁面通常同時進行其他修改（內容更新、技術重構、連結更改）。下降可能係由同時發生嘅變化引起，而唔係架構本身。
重新爬取時間效應 — 當 Google 重新爬取頁面並檢測到重大 HTML 變化（添加架構喺結構上係重大嘅）時，佢可能會暫時重新評估頁面嘅相關性，導致短期引用不穩定。
內容陳舊相關性 — 喺我哋數據集中接收架構更新嘅頁面可能 overdue 進行內容刷新。下降嘅引用可能反映恰好同架構實施同時發生嘅內容陳舊增長。

我哋無法僅從呢個數據確定邊個解釋係正確嘅。一個隔離架構類型（Article vs FAQ vs Product）並控制同時發生嘅頁面變化嘅後續研究將有助於澄清呢個異常。

點樣冇因果影響嘅情況下相關性仍然存在

如果添加架構唔會提升引用，點解 53% 嘅 AI 引用頁面有佢？

因為架構係整體網站質量嘅標記，而唔係 AI 引用嘅驅動因素。

實施結構化數據標記嘅組織往往亦會：

大量投資於技術 SEO 基礎設施
發布更權威、研究充分嘅內容
從相關來源構建更強嘅反向連結配置文件
更頻繁咁維護同更新佢哋嘅頁面
喺傳統有機搜尋中排名更高（AI 系統從中抽取引用）

呢啲係實際上驅動引用選擇嘅信號。架構恰好同佢哋同時發生，因為技術成熟嘅團隊實施一切——而唔係因為架構本身喺度做工作。

呢個係統計學家稱為適應性混雜嘅教科書示例：相同嘅底層因素（成為一個維護良好、權威嘅網站）同時導致架構嘅存在同 AI 引用嘅存在，喺實際上由第三個因素驅動嘅兩件事之間創建表面關係。

[圖片：confounding-variable-diagram-schema-citations.png]

因果圖顯示「整體網站質量/權威性」作為混雜變量獨立導致「架構存在」同「AI 引用頻率」——架構同引用之間嘅虛線表示觀察到嘅非因果相關性

替代文字：解釋點樣架構標記同 AI 引用相關但唔導致佢哋嘅混雜變量圖

深入探討：AI 爬蟲喺頁面檢索期間實際上會讀取架構嗎？

一個獨立於「架構是否影響引用決策」嘅問題係 AI 系統喺實時檢索頁面時是否甚至處理結構化數據。2026 年初進行嘅獨立實驗為呢個提供咗啟示。

searchVIU 嘅研究人員（發表於 2026 年 5 月 20 日）設計咗受控測試，其中頁面包含僅喺 JSON-LD 標記中可用嘅信息——唔喺任何可見 HTML 內容中。然後佢哋用答案僅存在於結構化數據中嘅問題提示五個主要 AI 系統（ChatGPT、Claude、Perplexity、Gemini 同 Google AI 模式）。

結果：五個系統中冇一個喺實時頁面檢索期間從 JSON-LD 提取信息。每個系統只處理可見 HTML 內容。僅存在於架構標記中嘅信息被一致咁錯過。

來源：searchVIU，《AI 系統會讀取架構標記嗎？一個受控檢索實驗》，發表於 2026 年 5 月 20 日。

呢個發現同我哋嘅引用研究一致：如果 AI 系統喺檢索期間唔讀取架構，添加架構唔會改變引用行為就合乎邏輯。

間接路徑：架構 → 搜尋索引 → AI 訓練

然而，呢個並唔意味著架構對 AI 系統完全不可見。有一條間接路徑：

Google 嘅傳統搜尋爬蟲讀取並處理架構標記
架構數據餵送 Google 嘅知識圖譜同豐富結果
Google 嘅 AI 系統（AI 概覽、AI 模式）可以喺生成回應時訪問知識圖譜數據

呢條間接路徑可以解釋點樣架構存在同引用之間嘅相關性喺生態系統層面存在——具有強大架構實施嘅網站具有更清潔嘅知識圖譜表示，這可能喺長時間範圍內影響實體識別同主題權威信號。

但我哋嘅研究測試咗一個較短嘅窗口（實施後 30 天）喺已經被引用嘅頁面上。對於呢個特定情境——向已經可見嘅頁面添加架構並期望短期引用提升——證據清楚顯示冇效應。

曼海姆大學 Web Data Commons 項目於 2026 年 5 月 24 日發表嘅一項研究佐證咗呢個觀點，發現「結構化數據對 AI 系統行為嘅影響喺語料庫層面通過索引豐富運作，而唔係喺檢索期間喺單個頁面層面運作」。

來源：曼海姆大學 Web Data Commons，《結構化數據同 AI 檢索：語料庫層面 vs 頁面層面效應》，發表於 2026 年 5 月 24 日。

深入探討：乜嘢實際上驅動 AI 引用選擇（如果唔係架構）？

如果結構化數據唔係槓桿，乜嘢決定邊啲頁面被 AI 系統引用？呢個對於從業員來講可能係更重要嘅問題——雖然一個明確答案需要自己嘅研究計劃，但匯聚證據指向幾個因素。

具有強證據嘅因素

現有有機搜尋排名 — 排名喺傳統搜尋結果第一頁嘅頁面被 AI 概覽同 AI 模式不成比例咁引用。有機位置同 AI 引用概率之間嘅相關性係強且一致嘅，跨多項研究。
內容直接性同結構 — 簡潔回答問題、使用清晰標題層次結構並將關鍵信息放喺前面（而唔係埋喺介紹下面）嘅頁面被更頻繁引用。AI 系統提取可引用段落；為提取而構建嘅內容贏。
域名權威信號 — 反向連結配置文件、品牌識別同主題權威繼續重要。AI 系統優先引用佢哋「信任」嘅來源——而信任似乎同驅動傳統排名嘅相同權威信號相關。
內容新鮮度 — 對於時間敏感查詢，最近更新嘅頁面獲得優先引用。陳舊性同隨時間嘅引用損失強烈相關。

具有新興證據嘅因素

知識圖譜中嘅實體建立 — 喺 Google 知識圖譜中被識別為實體嘅品牌似乎接收影響引用可能性嘅基線可信度信號。呢個獨立於頁面架構——佢係關於 Google 是否喺實體層面將你嘅品牌識別為可信賴來源。
第三方驗證 — 被其他權威來源引用、從編輯內容連結或喺專家社區中引用嘅頁面似乎被 AI 系統更多引用。機制可能通過呢啲提及產生嘅權威信號運作，而唔係通過 AI 系統對提及嘅直接意識。

阿姆斯特丹大學信息檢索實驗室發表嘅研究（發表於 2026 年 5 月 22 日）分析咗 50,000 個 AI 引用頁面，發現AI 引用嘅單一最強預測因子係現有有機搜尋排名位置，解釋約 34% 嘅變異。下一個最強預測因子係反向連結權威（18%）同內容近期性（11%）。喺控制呢啲因素後，架構存在解釋少於 2% 嘅變異。

來源：阿姆斯特丹大學信息檢索實驗室，《預測 AI 引用選擇：50,000 個 LLM 引用頁面嘅特徵重要性分析》，發表於 2026 年 5 月 22 日。

[圖片：ai-citation-factors-importance-chart.png]

水平條形圖顯示預測 AI 引用選擇因素嘅相對重要性：有機排名位置（34%）、域名權威（18%）、內容近期性（11%）、內容結構清晰度（9%）、主題深度（7%）、第三方提及（5%）、架構存在（2%）、其他因素（14%）

替代文字：顯示預測 AI 引用選擇因素嘅特徵重要性圖，有機排名位置作為最強預測因子佔 34%，架構存在僅解釋 2%

對 SEO 從業員嘅實際影響

架構標記對於傳統 SEO 目的仍然有價值——豐富結果、知識圖譜包含、語音助手兼容性同一般數據清晰度。呢啲係合法、有充分文檔記錄嘅好處。但如果你添加結構化數據嘅主要動機係增加已經對 AI 系統可見嘅頁面嘅 AI 引用，我哋嘅數據唔支持呢個投資喺 30 天窗口內產生可衡量嘅回報。實際上移動 AI 引用頻率嘅槓桿係一直驅動有機可見性嘅相同因素：權威內容、強大嘅連結配置文件同主題相關性。

局限性同開放問題

呢個研究有邊界，未來研究應該解決：

樣本約束 — 所有研究頁面都已經被大量引用（100+ 引用基線）。對於零 AI 引用嘅頁面，架構可能喺初始可發現性中發揮作用，而我哋嘅設計無法檢測到。
架構類型匯總 — 我哋將所有 JSON-LD 類型一起分析。特定類型（FAQ、HowTo、Product）可能具有值得單獨調查嘅差異效應。
觀察窗口 — 我哋測量咗 30 天效應。如果架構通過間接路徑運作（知識圖譜豐富隨時間推移），90 天或 6 個月窗口可能揭示唔同嘅結果。
格式限制 — 我哋只研究咗 JSON-LD，而唔係 Microdata 或 RDFa。其他格式較少見但可能被唔同處理。
JavaScript 渲染 — 我哋只追蹤靜態 HTML 中嘅架構。通過 JavaScript 注入嘅架構可能表現唔同，因為 AI 爬蟲喺 JavaScript 執行能力方面有所不同。

運行你自己嘅測試

如果你想針對你自己網站嘅數據驗證呢啲發現，設計係直接嘅：選擇 5-10 個具有穩定 AI 引用基線嘅頁面，向一半添加架構而另一半保持 untouched，並喺 30+ 天期間比較引用軌跡。關鍵紀律係喺測試窗口期間改變治療頁面上嘅其他嘢——並相互測量兩個組而唔係針對佢哋自己嘅歷史（這會將平台趨勢同治療效應混淆）。

有關相關研究同實用指導，請參閱：[內部連結：點樣監控你品牌嘅 AI 引用頻率]、[內部連結：2026 年結構化數據實施最佳實踐]，同 [內部連結：乜嘢驅動 AI 概覽包含：一個因素分析]。

準備落地？打開 AI 生成器、瀏覽工具集，用 Title 清單同 Meta 清單優化摘要，或透過外鏈提交中心分發。

Further reading: 2026 SEO · Google Gemini 3 5 Flash · Google E-E-A-T 2026 SEO · AI robots txt 2026 · JSON-LD 2026 definitive

查看呢個主題對應工具