頁面取消索引怎麼救?deindex 排查與重新收錄流程

某天打開 Google Search Console,發現一篇原本有流量、有排名的文章突然從搜尋結果裡消失,site: 指令也查不到——這就是頁面取消索引(deindex)。它跟「新文章還沒被收錄」是兩回事:前者是 Google 曾經把頁面存進資料庫、後來又主動移除,後者只是還沒輪到爬蟲來看。

頁面取消索引絕大多數不是 Google 在懲罰你,而是 noindex 標籤被誤加、robots.txt 把路徑擋掉、伺服器回應錯誤、canonical 指錯,或內容被判定價值不足這幾類原因。少數情況才是人工判罰或網站遭入侵。

這篇會先教你分清楚「真的被取消索引」還是「只是排名掉了」,接著用一套有順序的排查路徑找出根因,最後把修好之後的重新收錄流程、合理的等待時間一次講完。WordPress 與 WooCommerce 站長最容易踩的設定地雷,也會單獨拉出來說。

頁面被取消索引是什麼意思?跟「從沒被收錄」差在哪

頁面取消索引指的是一個曾經被 Google 收進索引、能在搜尋結果出現的網頁,後來被 Google 從索引資料庫移除,於是搜不到、site: 也查不到。關鍵字是「曾經被收錄過」。

這跟兩個容易混淆的狀況要分開:

  • 從未被索引:新發布的頁面還在等爬蟲,GSC 顯示「已找到 – 目前尚未建立索引」或「已檢索 – 目前尚未建立索引」。它從來沒進過索引,談不上被取消。
  • 被取消索引(deindex):頁面進過索引、有過排名與曝光,某個時間點起 GSC 的曝光與點擊歸零,網址審查顯示「網址不在 Google 中」。

為什麼要先分清楚?因為兩者的處理方向不同。從未被索引多半要補內容深度、補內部連結、等爬蟲;被取消索引則要回頭找「是什麼設定或事件,把一個原本健康的頁面踢出去」。把 deindex 當成新頁面慢慢養,會錯過真正的根因。

索引是排名的前置條件,不是排名本身。頁面只要不在索引裡,SEO 做得再用心都沒有舞台,所以 deindex 是優先級最高、要先處理的問題。

怎麼確認頁面真的被取消索引,而不是排名掉了

確認的標準動作只有一個:用 GSC 的網址審查工具查單一網址,看它回「網址在 Google 中」還是「網址不在 Google 中」。不要用關鍵字搜尋自己的標題來判斷,因為搜不到有三種完全不同的可能。

很多站長一發現搜不到文章就慌,其實要先排除掉「不是 deindex」的兩種情況:

  • 排名掉到後面:頁面還在索引裡,只是被競爭對手或自己站內其他文章蓋過去,排到第二、三頁。這是排名問題,不是索引問題,要從關鍵字、內容、反向連結下手。
  • 被站內同主題文章吃掉曝光:兩篇題材太接近,Google 只選一篇給排名。頁面仍被索引,處理方向是拉開兩篇的差異或合併。

把上面兩種排除後,用三個工具交叉確認是不是真的 deindex:

  • 網址審查工具(最準):在 GSC 上方搜尋列貼完整網址,直接看「在 Google 中/不在 Google 中」,還會給出具體的未收錄原因。
  • site: 指令查單頁:Google 搜尋欄輸入 site: 加上完整文章網址,找不到代表這篇目前不在索引。
  • 比對 GSC 歷史數據:到「成效」報表看這個網址的曝光與點擊,如果是某個日期之後突然歸零、之前一直有量,那就是 deindex 的明確訊號,而且那個日期往往就是問題發生的時間點。

抓到「曝光歸零的轉折日」很重要,它能幫你回想當天前後有沒有改設定、裝外掛、改版或搬家,根因常常就藏在那裡。

頁面被 Google 取消索引的原因有哪些

頁面取消索引的原因可以分成「技術設定擋住」「內容被判定價值不足」「人工判罰或安全問題」三大類,依發生頻率,技術設定誤擋最常見,人工判罰最少見。亂槍打鳥地修只會浪費時間,建議照下面這個順序往下排查,先排除高頻又好查的,再處理棘手的。

用網址審查工具看未收錄原因
排查起點
1. 有沒有人工判罰或安全警示
最優先
2. 是不是 noindex 或 robots.txt 誤擋
最常見
3. 有沒有 404、5xx、403 等狀態碼
技術層
4. canonical 指錯或重複內容
設定層
5. 內容深度不足被重新評估
內容層

noindex 標籤被誤加是頭號元凶

被取消索引的頁面裡,最常見的就是 <meta name="robots" content="noindex"> 這行標籤被加到了不該加的頁面上。網址審查的詳情會直接寫「已遭 noindex 標記排除」。

它分兩種要分開看。一種是該擋的:RSS feed(路徑含 /feed/)、後台路徑、登入頁、訂單與會員專區這類本來就不該出現在搜尋結果的頁面,被 noindex 是正常的,看到不用動。另一種是誤擋:正常的文章或商品頁被加了 noindex,這才是要修的。判斷方法是看被擋網址的路徑,如果是正常內容頁卻被擋,要回頭查 SEO 外掛、主題設定或佈景的 SEO 區塊。

robots.txt 封鎖會讓爬蟲連看都看不到

robots.txt 用 Disallow 規則把某個路徑擋掉,爬蟲就不會去抓,頁面自然掉出索引。同樣分故意擋與誤擋:/wp-admin//wp-includes/、feed 路徑被擋是健康的;如果是安全外掛或快取外掛自動寫的規則把 /wp-content/ 或正常文章路徑整段 disallow,連圖片都會被擋,這就要把 robots.txt 改回來。

要特別留意,robots.txt 封鎖和 noindex 不能同時用在同一頁。如果你想讓某頁退出索引而設了 noindex,卻又在 robots.txt 把它擋掉,爬蟲根本讀不到那行 noindex,指令就失效了,反而清不掉。要移除索引時,先放行 robots.txt 讓爬蟲讀得到 noindex,等清掉後再考慮其他設定。

狀態碼異常會讓頁面被當成壞掉

Googlebot 來抓時拿到的 HTTP 狀態碼,決定了它要不要保留索引:

  • 404(找不到):頁面被刪或網址改了沒做轉址。若文章搬家,用 301 永久轉址指向新網址;若永久刪除,用 410 比 404 更明確,Google 清除速度更快。
  • 5xx(伺服器錯誤):主機回 500、502、503。正常文章網址出現 5xx 才要緊張,可能是主機效能不足、外掛衝突或防火牆把 Googlebot 誤擋;後台路徑出現 5xx 多半是站長主動做的保護,不是故障。5xx 持續太久,Google 會降低爬取頻率,連帶影響全站。
  • 403/401(拒絕存取/未授權):客戶端被擋在門外。常見於防火牆、CDN 或安全外掛把 Googlebot 當成攻擊流量。如果頁面本該公開,要在防火牆白名單放行 Googlebot。
  • 軟性 404(Soft 404):頁面內容已經是「找不到」或空白,卻回傳 200 狀態碼。Google 判讀出內容不可用、與狀態碼矛盾,就不給索引。要把這類頁面改成真正的 404,或補回實質內容。

canonical 指錯或重複內容讓 Google 選了別頁

頁面設了 canonical 標記指向另一個網址,等於告訴 Google「請收那一頁、別收我」,於是這頁退出索引。常見於外掛自動產生帶 utm 參數的網址、商品變體、分頁。如果 canonical 指對了,這是正常的流量集中設定;如果是外掛把 canonical 設錯、指到不相干的頁面,就會把該收的頁面也擠出索引。

重複內容也會觸發類似結果。兩篇題材太接近時,Google 會自己選一篇收、把另一篇判為重複而不索引。處理方向是拉開兩篇差異、或用 canonical 明確指定主版本。

內容被重新評估為價值不足

頁面原本被收錄,後來 Google 重新檢索時把它降級為「已檢索 – 目前尚未建立索引」,等於收回了索引資格。這通常代表內容深度不夠、跟站內其他文章太相似、或更新後品質下滑。修法不是去點按鈕,而是補上實戰細節、具體步驟、案例與獨到觀點,把頁面對讀者的幫助做出來,再請求重新檢索。用 AI 打草稿沒問題,但沒有加進自己的判斷與實例,Google 判定的還是價值不足。

WordPress 與 WooCommerce 最常見的取消索引地雷在哪

WordPress 與 WooCommerce 站台被取消索引,根因往往不在 Google,而在後台某個沒注意的開關。下面幾個是最容易把整站或整批頁面擋掉的地雷:

  • 「設定 → 閱讀」勾了「禁止搜尋引擎索引此網站」:架站初期測試常勾起來,正式上線忘了取消,結果全站被 noindex。這是最致命也最常見的一個,發現整站集體 deindex 先查這格。
  • SEO 外掛預設把封存頁設成 noindex:Yoast、Rank Math、Slim SEO 預設常把分類頁、標籤頁、附件頁設成 noindex。如果你正在經營某個分類頁,要記得開回來。
  • 正式站與測試站設定搞混:在測試環境(staging)刻意擋掉索引,搬上正式站時把那份設定一起帶過來,或反過來讓測試站被索引、跟正式站打架。
  • WooCommerce 的購物車、結帳、我的帳戶頁本來就該 noindex:這幾頁是交易動線,不需要出現在搜尋結果,被 noindex 是正確設定,不要誤以為是問題去開放它。真正要顧的是商品頁與商品分類頁有沒有保持可索引。
  • 商品變體與篩選網址造成重複:顏色、尺寸變體與帶參數的篩選網址會生出大量近似頁面,canonical 沒設好就會讓主商品頁被判重複。確認變體網址的 canonical 都指回主商品頁。
  • 快取或防火牆外掛改寫 robots.txt 或誤擋 Googlebot:Cloudflare、Wordfence 這類工具可能把 Googlebot 當攻擊流量擋掉。在防火牆白名單放行 Googlebot 的官方 IP 區段即可。

實務上的習慣:每次裝外掛、換主題、搬家或改版之後,回 GSC 用網址審查工具抽查幾篇重要文章與幾個重點商品頁,確認狀態正常再去做別的事,能擋掉九成這類意外。

確認被人工判罰或網站遭入侵時該怎麼處理

如果上面的技術與內容排查都沒問題,頁面卻整批甚至整站消失,要往人工判罰與網站遭入侵這兩個方向查,這也是少數需要走「重新審查(reconsideration)」流程的情況。

人工判罰會在 GSC 留下明確通知。到「安全性與人工判罰」底下的「人工判罰」看有沒有訊息,Google 會寫明違規類型,常見的是不自然的連結(短時間內灌入大量低品質反向連結、參與連結交換)、大量重複或自動生成的低品質內容、隱藏內容(cloaking,給使用者與爬蟲看不同內容)。處理方式是先把違規修掉——清理或否認(disavow)不自然連結、移除或重寫低品質頁面、停止任何隱藏內容的手法——確認都改完,再提交重新審查申請,誠實說明發生了什麼、做了哪些補救。修好之前送申請只會被駁回。

網站遭入侵則多半同時觸發索引移除與安全警示。被植入惡意程式、被導向惡意頁面,或被駭客用 cloaking 手法操控時,Google 幾乎一定會把站台移出索引保護使用者。處理順序是先掃描並清除惡意程式、修補被入侵的漏洞與被竄改的頁面,必要時用專業的網站清理服務,確認乾淨後在 GSC 的「安全性問題」報表送出審查。隱藏內容有時不是你的錯,付費牆內容或被駭都可能被誤判,這種情況要按官方規範用結構化資料標明,再申請審查。

人工判罰與安全問題的共同點是:必須先真正解決根因,再透過審查申請向 Google 表達誠意,恢復時間通常比技術誤擋更長。

修好原因後,重新收錄的完整流程怎麼跑

根因修好後,重新收錄不是猛按「要求建立索引」就會發生,而是有一條讓 Google 確認你已改善、再重新爬取的流程。照順序跑效率最高:

第一、用網址審查工具再確認一次。修改後重新貼上網址測試,看 noindex、robots.txt、狀態碼問題是否都已消除。確認乾淨了才往下走,不然後面都是白做。

第二、該驗證的就按「驗證修正」。如果你是在 GSC 的網頁索引報表裡看到某類問題(例如一批頁面遭 noindex 排除),修好後到那筆問題旁按「驗證修正」,等於重新交卷請 Google 複查。問題沒真的修好就反覆按驗證,對網站沒有任何幫助。

第三、重新提交 Sitemap。確認 sitemap.xml 已包含正確的最新網址,到 GSC 的「Sitemaps」重新提交一次,幫爬蟲一次拿到完整的待爬清單。

第四、對重要單頁手動「要求建立索引」。在網址審查頁面看到「網址不在 Google 中」時按「要求建立索引」,把這頁推進爬取佇列。這個動作對單一重要頁面有效,但 Google 對每站每天有配額,不要對整批頁面狂按,一般文章交給 sitemap 與爬蟲自然處理就好。

第五、補內部連結幫 Google 確認主版本。在站內已收錄、有權重的頁面補上指向待救頁面的內部連結,給爬蟲一條明確的路徑,也強化這頁的重要性訊號。

第六、人工判罰或安全問題另走審查申請。技術與內容修好走上面五步就夠;若根因是人工判罰或遭入侵,要額外在對應報表送出重新審查申請,並附上具體的補救說明。

整個流程的精神是「先修好、再讓 Google 知道你修好了」,而不是在沒解決根因的情況下反覆催促。

要求建立索引後多久會回來?哪些訊號代表還沒好

要求建立索引後的恢復時間沒有保證值,技術誤擋類的問題修好後,快則一天到三天進爬取佇列、一到兩週恢復;內容價值類的重新評估可能要數週到數個月;人工判罰與安全問題走完審查,往往要更久,且排名不一定立刻回到原位。

恢復速度跟網站的爬取頻率高度相關。穩定更新、有一定權重的站,爬蟲回訪勤、恢復快;很久沒更新或權重低的站,爬蟲幾週才回來一次,就得多等。想讓爬蟲來得勤,最有效的不是狂按要求索引,而是維持穩定的發布與更新節奏。

等待期間,用這幾個訊號判斷是進度正常還是該再查一次:

  • 網址審查狀態已轉為「網址在 Google 中」:代表已重新收錄,接著觀察成效報表的曝光有沒有回來即可。
  • 狀態仍是同一個錯誤:表示根因沒真的修掉,要回頭重查設定,不是繼續等。
  • 整站連續一個月以上沒有新增任何索引筆數:超出正常範圍,要查整站層級的問題(robots.txt、全站 noindex、主機狀況)。
  • site: 加網域完全查不到任何結果:訊號偏嚴重,優先確認是不是全站被 noindex、被 robots.txt 整段擋掉,或收到人工判罰。

頁面取消索引看起來嚇人,但它幾乎都是可逆的。真正決定能不能救回來、多快救回來的,是有沒有找對根因、對症下藥,而不是反覆去點同一顆按鈕。先用網址審查工具看清楚 Google 給的原因,照「人工判罰與安全→noindex 與 robots→狀態碼→canonical 與重複→內容」的順序排查,把根因修乾淨,再走完驗證、重提 sitemap、補內部連結這條流程,剩下的就交給時間。下次裝外掛或搬家後,順手抽查幾頁的索引狀態,就能在頁面掉出索引之前先攔下來。

相關文章
標籤: Google Search Console, noindex, 頁面取消索引, deindex, 重新收錄