WordPress Sitemap 完整設定指南:外掛配置、GSC 提交與收錄率排查

很多站長在架站初期就完成 sitemap 提交,把網址送進 Google Search Console(GSC)後便以為大功告成。幾個月後打開索引報告,才發現幾十頁的收錄數字停在個位數——XML 網站地圖(Sitemap)裡混著 noindex 頁面、重定向鏈,或者 canonical 指向其他網址,等於把錯誤的頁面名單交給 Google,讓它在裡頭篩了半天卻幾乎收不到東西。

本文從 XML Sitemap 的結構要求說起,帶出 WordPress 外掛的設定要點,再走完 GSC 的提交與監控流程,最後把收錄率低時的排查邏輯逐一展開。讀完之後,你會知道哪些頁面不該進 Sitemap、出問題時要從哪個角度切入。

XML Sitemap 的結構與格式限制

XML Sitemap 的本質是一份給搜尋引擎的頁面清單,格式由 sitemaps.org 協議規範,Google、Bing 等主流搜尋引擎都遵守這份規範。

協議規定每份 Sitemap 檔案最多收錄 50,000 個 URL,未壓縮時檔案大小不超過 50 MB。超過這個上限,搜尋引擎的解析器不保證完整讀取。實務上,當網站頁面數超過一萬,通常會產出 Sitemap Index 檔案作為主索引,底下再掛多份子 Sitemap,每份按頁面類型分類,文章、分類頁、標籤頁、商品頁各自獨立成一份,讓搜尋引擎可以針對特定類型單獨排程爬取。

格式上有幾個細節值得注意。<loc> 標籤裡的網址必須與 GSC 驗證的網站屬性完全一致,包括 httpshttp 的差異、有無結尾斜線,只要一個字元不符,GSC 就會把它視為「不屬於本屬性的網址」而無法處理。<lastmod> 代表最後修改時間,填 W3C 日期格式(例如 2026-05-17),只有在頁面確實有內容更新時才異動,不要每次重新產生 Sitemap 就把所有頁面的時間戳記一次刷新——那樣會干擾搜尋引擎對爬取優先度的判斷。至於 <priority><changefreq> 這兩個選填欄位,Google 官方已明確表示幾乎不採用,填了也不影響抓取頻率,可以略過。

WordPress 外掛產生 Sitemap 的設定要點

WordPress 本身從 5.5 版開始內建基本的 XML Sitemap 功能,但大多數站長會改用 Yoast SEO 或 Rank Math 取代,因為這兩套外掛的設定介面更細,可以指定哪些頁面類型要排除。

以 Yoast SEO 為例,後台路徑在「SEO → 一般 → 功能」,確認「XML 網站地圖」已開啟後,進入各個內容類型的設定,把「顯示在搜尋結果中」切成「否」的類型,Yoast 就會自動把那些頁面排除於 Sitemap 之外。常見需要排除的類型包括媒體附件頁(WordPress 預設會為每個上傳的圖片生成一個附件頁,內容幾乎是空的)、作者封存頁(若網站只有一位作者,這些頁面基本是重複內容),以及任何手動設為 noindex 的頁面。

Rank Math 的邏輯相似,在「Sitemap」模組底下可以按文章類型逐一勾選要不要納入。有一個常見的誤操作是把整個分類或標籤的 Sitemap 關掉,但分類頁如果有流量、有獨立的描述文字,是可以收錄的,不要因為擔心重複內容就全部排除,應針對真正沒有實質內容的頁面個別關閉。

外掛產生 Sitemap 後,網址通常是 https://你的網站.com/sitemap_index.xml(Yoast)或 https://你的網站.com/sitemap.xml(Rank Math),在瀏覽器直接開這個網址確認能正常顯示,再進行後續操作。如果頁面回傳 404,大機率是固定網址(Permalink)結構沒重新整理,去「設定 → 固定網址」按一次儲存即可。

透過 GSC 提交與監控 Sitemap

進入 GSC 後,左側選單「索引 → 網站地圖」就是提交入口。在「輸入網站地圖網址」欄位填入 Sitemap Index 的完整 URL 後送出,GSC 會在數分鐘到數小時內回傳初步的解析結果。

提交後要觀察的欄位有三個,分別是「已提交的網址數」「已索引的網址數」以及「狀態」。狀態顯示「成功」只代表 GSC 能正常讀取這份 Sitemap,不代表裡面的頁面都已收錄。真正重要的是「已提交 vs. 已索引」的比例,如果提交了 200 個網址,索引只有 40 個,收錄率約 20%,就需要進一步排查原因。

首次提交後的等待期大約是一到兩週,新站或更新頻率低的網站可能等更久,這段時間不需要反覆重新提交,重複送出不會加速索引。如果確定有新頁面發布,可以在 GSC 的「網址審查工具」輸入該頁面的 URL,點「要求索引」讓 Google 優先排程。

監控節奏建議每兩週看一次 Sitemap 報告,不需要天天進去。需要特別關注的訊號是索引數字長期停滯不動(超過一個月都沒變化),或者「狀態」從成功變成「無法擷取」——後者通常代表伺服器或機器人協議(robots.txt)設定出了問題。

收錄率低時的四個排查方向

收錄率偏低時,問題幾乎都集中在以下幾個位置,逐一排查比較有效率。

noindex 標籤衝突:最常見的狀況是頁面設有 noindex 指令,卻同時出現在 Sitemap 裡。Google 遇到這種矛盾時,會選擇遵守 noindex,並在 GSC 的「頁面索引報告」中把這些頁面歸類為「已排除:noindex 標籤」。解法是在 Yoast 或 Rank Math 的設定確認,凡是 noindex 的頁面類型,外掛都會自動排除於 Sitemap 之外;若是個別頁面手動加了 noindex,也要確認那些頁面不出現在列表裡。

重定向鏈:Sitemap 裡如果放的是 301 或 302 重定向的舊網址,Google 爬取時會跟著轉址走,但轉址目的地才是最終可能收錄的版本。若轉址鏈超過兩層(A 轉 B 轉 C),Googlebot 有機率在中途放棄。正確做法是 Sitemap 只放最終目的地的 URL,不放任何會觸發重定向的網址。可以用 Screaming Frog 或 Ahrefs Site Audit 掃描現有 Sitemap,把其中的轉址網址過濾出來集中處理。

canonical 指向衝突:頁面 <head> 裡的 rel="canonical" 如果指向另一個 URL,就是告訴 Google「我不是正本,正本在那裡」。這種頁面就算放進 Sitemap,Google 也會優先收錄 canonical 指定的那個頁面。常見的觸發場景是分頁(?paged=2)、帶有 UTM 追蹤參數的頁面,或是主題在分類頁的第一頁與無分頁版產出了不同 URL 但 canonical 互指。排查方式是在 GSC 頁面索引報告篩選「替代頁面(含有適當 canonical 標記)」,那裡列出的頁面就是被 canonical 排除的對象,逐一確認指向是否正確。

爬取配額不足:中大型電商或內容量超過一萬頁的網站,Googlebot 的爬取配額可能不夠把所有 Sitemap 頁面都跑一遍。可以在 GSC 的「爬取統計資料」報告查看每日爬取次數是否有明顯的下滑趨勢。改善方向包括提升頁面回應速度(伺服器首次位元組時間 TTFB 目標壓在 200 毫秒以內)、降低 5xx 伺服器錯誤的比例,以及清理掉 Sitemap 裡品質低落的頁面,讓配額集中在值得索引的頁面上。

收錄率的改善通常不是立竿見影的事,調整設定後再等兩到三週才能在 GSC 報告上看到數字變化。如果前述四個方向都排查過、設定都確認正確,但數字仍然停滯,接下來要考慮的是內容品質問題——Google 有可能認為這些頁面的資訊密度或原創性不足以收錄,這已超出技術設定的範疇,需要從內容層面重新評估。

相關文章
標籤: XML Sitemap, 收錄率, Rank Math, Google Search Console, Yoast SEO