谷歌SEO:如何查找和修復(fù)孤立頁面

來源:數(shù)聚梨海外營銷獨(dú)立站跨境電商
作者:數(shù)聚梨海外營銷獨(dú)立站跨境電商
時(shí)間:2022-05-10
1490
當(dāng)他們開始在歷史悠久的網(wǎng)站上工作時(shí),流沙等待毫無戒心的SEO。這些技術(shù)站點(diǎn)錯(cuò)誤的坑,由幾代以前的機(jī)構(gòu)散布,減慢并阻礙了SEO的努力和進(jìn)步。當(dāng)您負(fù)責(zé)清理它時(shí),找到快速修復(fù)是您的首要任務(wù)。

640 (1).png

當(dāng)他們開始在歷史悠久的網(wǎng)站上工作時(shí),流沙等待毫無戒心的SEO。這些技術(shù)站點(diǎn)錯(cuò)誤的坑,由幾代以前的機(jī)構(gòu)散布,減慢并阻礙了SEO的努力和進(jìn)步。當(dāng)您負(fù)責(zé)清理它時(shí),找到快速修復(fù)是您的首要任務(wù)。因此,您可以從基本的站點(diǎn)審核開始,然后查看幾個(gè)孤立頁面。您可能聽說過孤立頁面對網(wǎng)站不利,但不完全了解它們是什么以及如何修復(fù)它們。

什么是孤立頁面?

孤立頁面是搜索引擎可能難以發(fā)現(xiàn)的頁面,因?yàn)樗鼈儧]有來自您網(wǎng)站其他地方的內(nèi)部鏈接。這些URL往往會(huì)落空,因?yàn)樗阉饕媾老x只能從站點(diǎn)地圖文件或外部反向鏈接中發(fā)現(xiàn)頁面,而用戶只有知道URL才能訪問該頁面。

什么導(dǎo)致孤立頁面?

通常,孤立頁面是偶然的,并且由于各種原因而發(fā)生。最常見的原因是沒有用于站點(diǎn)遷移、導(dǎo)航更改、站點(diǎn)重新設(shè)計(jì)、缺貨產(chǎn)品、測試或開發(fā)頁面的流程。孤立頁面也可能是有意的,例如促銷和付費(fèi)廣告登陸頁面,或者您不希望頁面成為用戶旅程一部分的任何情況。

為什么孤立頁面對SEO不利?

搜索引擎很難找到孤立頁面,因?yàn)樗鼈兪褂面溄觼韼椭l(fā)現(xiàn)新內(nèi)容并了解頁面的重要性。這是谷歌所說的:

谷歌使用稱為爬蟲的自動(dòng)化程序搜索網(wǎng)絡(luò),尋找新的或更新的頁面。我們通過許多不同的方法查找頁面,但主要方法是跟蹤我們已經(jīng)知道的頁面的鏈接。

例如,假設(shè)您發(fā)布了一個(gè)新網(wǎng)頁,但忘記從您網(wǎng)站的其他地方鏈接到它。如果該頁面不在您的站點(diǎn)地圖中并且沒有反向鏈接,Google將不會(huì)找到或索引它。那是因?yàn)樗麄兊木W(wǎng)絡(luò)爬蟲不知道它的存在。更糟糕的是,該頁面無法獲得PageRank。一般來說,PageRank是谷歌通過計(jì)算一個(gè)頁面獲得的“票數(shù)”來理解頁面重要性的方式。

如何查找孤立頁面?

要在您的網(wǎng)站上查找孤立頁面,您需要將可抓取的URL列表(Google可以找到的)與人們在您網(wǎng)站上點(diǎn)擊的URL列表進(jìn)行比較。這聽起來很技術(shù)性,但不要?dú)怵H。我們使用您熟悉的工具將如何查找孤立頁面分解為三個(gè)簡單的步驟。

1.查找可抓取的URL

您可以使用許多工具來收集所有可抓取URL的列表。我們通常使用Ahrefs的站點(diǎn)審核,因?yàn)樗ㄟ^Ahrefs網(wǎng)站管理員工具帳戶完全免費(fèi),并且您可以選擇使用外部反向鏈接作為查找更多URL的來源。這是如何做到的:

·前往現(xiàn)場審核。

·單擊+新建項(xiàng)目。

·單擊URL源選項(xiàng)卡并選中反向鏈接作為URL源以及默認(rèn)設(shè)置。

·單擊繼續(xù),按照說明完成設(shè)置,然后運(yùn)行爬網(wǎng)。

反向鏈接數(shù)據(jù)對于查找孤立頁面很有用,因?yàn)樗鼘碜訟hrefs鏈接索引的URL混合在一起。如果頁面沒有任何內(nèi)部鏈接,則基本爬蟲將找不到它。但是,如果一個(gè)頁面有反向鏈接,Ahrefs會(huì)在您的網(wǎng)站上找到該URL,并且知道爬網(wǎng)沒有找到內(nèi)部鏈接,因此它一定是孤立頁面。站點(diǎn)審核完成后,從頁面資源管理器中導(dǎo)出所有內(nèi)部頁面并保存。您將在第3步中使用它。

2.查找有點(diǎn)擊的網(wǎng)址

下一步是獲取在我們網(wǎng)站上點(diǎn)擊的所有URL的列表。有很多方法可以做到這一點(diǎn),最好使用盡可能多的數(shù)據(jù)源。如果您有權(quán)訪問,則日志文件可以正常工作,因?yàn)樗鼈兪歉鼫?zhǔn)確的服務(wù)器端數(shù)據(jù)。我們不會(huì)深入了解如何訪問這些內(nèi)容,因?yàn)檫@取決于服務(wù)器的設(shè)置方式。但如果你選擇走這條路,這里有三種常見服務(wù)器類型的官方指南:

·訪問Apache日志文件(Linux)

·訪問NGINX日志文件(Linux)

·訪問IIS日志文件(Windows)

在本文中,我們將使用Google Analytics(GA4)和Google Search Console,因?yàn)槊總€(gè)人的過程基本相同。以下是在Google Analytics(GA4)中查找具有命中的URL的方法:

·登錄到您的數(shù)據(jù)洞察帳戶

·開始一個(gè)新的空白報(bào)告

·連接Google Analytics作為您的數(shù)據(jù)源

·選擇您正在分析的帳戶>選擇GA4媒體資源

·在您的報(bào)告中添加一個(gè)基本表格

·將數(shù)據(jù)源設(shè)置為在步驟4中創(chuàng)建的GA4屬性

·將維度設(shè)置為頁面路徑

·將指標(biāo)設(shè)置為視圖

·按視圖降序排序

·將默認(rèn)日期范圍設(shè)置為在網(wǎng)站上安裝GA4之前

要從表格中導(dǎo)出結(jié)果,請單擊右上角的三個(gè)垂直點(diǎn),然后點(diǎn)擊導(dǎo)出。使用有用的名稱保存,例如“date_GA_URLs_people_are_hitting_brandname”,因?yàn)樯院竽鷮⒃俅涡枰R驗(yàn)槲覀儗?dǎo)出了頁面路徑而不是完整的頁面URL,所以我們需要將域添加到電子表格中所有單元格的開頭。這在Google表格中很容易。只需將CSV導(dǎo)入空白表,在左側(cè)插入一個(gè)新列,然后將此公式粘貼到單元格A1中(確保將example.com替換為您的域):

=IFERROR(ARRAYFORMULA(IF(ISBLANK(B:B),"",IF(B:B="Page Path","",IF(B:B="(not set)","","https://example.com"&B:B)))))

由于多個(gè)URL來源總是最好的,我們還將從Google Search Console(GSC)中提取數(shù)據(jù)。GSC將導(dǎo)出限制為前1,000個(gè)URL,但Google Data Studio有一個(gè)巧妙的小技巧,可以讓您提取更多。你可以嘗試這么做:

·重新打開您的數(shù)據(jù)洞察報(bào)告。

·開始一個(gè)新頁面(command+M)。

·打開資源>管理添加的數(shù)據(jù)源。

·單擊添加數(shù)據(jù)源。

·選擇搜索控制臺(tái)。

·選擇您正在分析的網(wǎng)站>URL展示>網(wǎng)絡(luò)。

·在您的報(bào)告中添加一個(gè)基本表格。

·將維度設(shè)置為著陸頁。

·將指標(biāo)設(shè)置為展示次數(shù)。

·將每頁的行數(shù)擴(kuò)展到5,000。

·編輯日期范圍以至少查看過去三個(gè)月。

·從表中導(dǎo)出結(jié)果。

·將您的工作表命名為“日期GSC_URLs_people_are_hitting_brandname”之類的有用名稱,因?yàn)樯院竽鷮⒃俅涡枰?/p>

現(xiàn)在,將人們從您的不同來源訪問的所有URL合并到一個(gè)電子表格中,并通過刪除重復(fù)項(xiàng)來清理數(shù)據(jù)。

3.交叉引用兩個(gè)URL源

最后一步是交叉引用可抓取的URL(來自Ahrefs的Site Audit)和具有命中的URL(來自GA和GSC)。為此,請創(chuàng)建一個(gè)空白Google表格并創(chuàng)建三個(gè)選項(xiàng)卡。將它們標(biāo)記為爬網(wǎng)、點(diǎn)擊和交叉引用。在第一張表中,從Ahrefs的站點(diǎn)審核中抓取、復(fù)制和粘貼所有可抓取的URL。

要找到這些,請打開從第1步導(dǎo)出的CSV并過濾傳入AllLinks等于零的結(jié)果。這非常重要,因?yàn)檫@些是孤立頁面,因此將它們包含在“爬網(wǎng)”選項(xiàng)卡中會(huì)導(dǎo)致交叉引用時(shí)結(jié)果不準(zhǔn)確。相反,您應(yīng)該復(fù)制這些URL并將它們添加到“點(diǎn)擊”選項(xiàng)卡中。接下來,將Ahrefs導(dǎo)出中的剩余URL復(fù)制并粘貼到Google表格的抓取標(biāo)簽中。

在第二張表中,點(diǎn)擊,復(fù)制/粘貼第2步中的所有URL。這些是您使用Google Analytics、Google Search Console或您的站點(diǎn)日志文件找到的頁面。它包括用戶訪問過的網(wǎng)頁。在第三張表中,交叉引用,在第一個(gè)單元格中輸入以下函數(shù):

=UNIQUE(FILTER(hits!A:A,ISNA(MATCH(hits!A:A,crawl!A:A,0))))

點(diǎn)擊進(jìn)入。該功能將自動(dòng)拉取所有孤立頁面,以便于分析。

如何修復(fù)孤立頁面?

營銷人員經(jīng)常犯的錯(cuò)誤是簡單地將內(nèi)部鏈接添加到所有孤兒頁面。這種方法的主要問題是,僅僅因?yàn)榭梢栽谒许撁嫔蠎?yīng)用快速修復(fù)并不意味著它應(yīng)該是。一些孤立頁面是有意的,如PPC登錄頁面,而其他頁面則可以被刪除,如測試頁面。我們不想浪費(fèi)資源來修復(fù)沒有損壞或不太可能產(chǎn)生積極影響的東西。

如果在站點(diǎn)遷移期間丟失了一個(gè)頁面,并且該頁面對訪問者沒有任何價(jià)值,那么刪除它可能是最好的選擇。但是,如果頁面有反向鏈接,也可能值得將URL重定向到另一個(gè)相關(guān)頁面以保持反向鏈接的公平性。讓我們看看修復(fù)孤立頁面的四種策略。

1.內(nèi)部鏈接

對網(wǎng)站訪問者有價(jià)值的孤立頁面應(yīng)合并到您網(wǎng)站的內(nèi)部鏈接結(jié)構(gòu)中,以使訪問者和搜索引擎更容易找到它們。例如,假設(shè)在網(wǎng)站遷移或重新設(shè)計(jì)期間忘記了一篇文章。我們需要從我們知道谷歌很快(重新)抓取的相關(guān)頁面內(nèi)部鏈接到它。這是在Ahrefs中執(zhí)行此操作的簡單方法:

·前往現(xiàn)場審核

·打開您網(wǎng)站的最新抓取

·在工具>打開頁面資源管理器下

·在頁面文本中搜索單詞或短語

·按自然流量對結(jié)果進(jìn)行排序

2.無索引

有意不在內(nèi)部鏈接的孤立頁面(例如廣告的登錄頁面)不應(yīng)編入索引,以防止它們出現(xiàn)在自然搜索結(jié)果中。大多數(shù)SEO插件使這變得像選中一個(gè)框一樣簡單,但您也可以通過將其復(fù)制并粘貼到頁面的<head>部分來手動(dòng)完成:

<meta name="robots"content="noindex"/>

確保這些頁面在robots.txt中仍然可以抓取。否則,搜索引擎將看不到noindex指令。

3.合并

合并與另一個(gè)頁面具有相同或相似內(nèi)容的孤立頁面。這意味著合并內(nèi)容并將孤立URL重定向到其他頁面。例如,假設(shè)您有相同產(chǎn)品的兩個(gè)產(chǎn)品列表。其中之一是孤立頁面;另一個(gè)不是。您應(yīng)該從孤立頁面獲取任何唯一有價(jià)值的信息并將其添加到另一個(gè)頁面,然后再將孤立頁面重定向到那里。

4.刪除

應(yīng)該刪除對訪問者沒有價(jià)值且沒有其他目的(例如付費(fèi)流量活動(dòng))的孤立頁面。例如,可以刪除未使用的CMS主題頁面。這將導(dǎo)致出現(xiàn)404頁面,并且隨著時(shí)間的推移自然會(huì)退出搜索結(jié)果。如果頁面有反向鏈接,您可能希望將URL重定向到另一個(gè)相關(guān)頁面,以在刪除后保留鏈接公平性。

如何防止孤立頁面?

如您所見,審核孤立頁面非常耗時(shí)。因此,一旦您投入工作,您就希望將來防止出現(xiàn)孤立頁面。以下是一些需要考慮的政策和程序。

1.制定網(wǎng)站遷移計(jì)劃

任何時(shí)候進(jìn)行網(wǎng)站遷移時(shí)都要制定計(jì)劃,積極主動(dòng)。您可以通過使用301重定向?qū)⑴f頁面重定向到新版本來避免網(wǎng)站上的鏈接斷開和混亂。

2.設(shè)置您的網(wǎng)站結(jié)構(gòu)以獲得成功

如果您必須手動(dòng)在內(nèi)部鏈接到新頁面,您一定會(huì)錯(cuò)過一些并最終得到孤立頁面。這就是為什么您應(yīng)該選擇為您處理內(nèi)部鏈接的網(wǎng)站結(jié)構(gòu)。大多數(shù)類型的CMS都是開箱即用的。例如,每次我們發(fā)布新的博客文章時(shí),WordPress都會(huì)從我們的博客主頁和存檔中添加一個(gè)內(nèi)部鏈接。但是,如果您使用的是自定義解決方案,則需要確保為良好的網(wǎng)站結(jié)構(gòu)準(zhǔn)備了必要的代碼。

3.正確移除停產(chǎn)產(chǎn)品

如果您經(jīng)營一個(gè)電子商務(wù)網(wǎng)站,您應(yīng)該從目錄中刪除停產(chǎn)產(chǎn)品(以及指向它們的所有內(nèi)部鏈接)并設(shè)置狀態(tài)代碼404或410。未能刪除此類產(chǎn)品的內(nèi)部鏈接是常見原因孤立頁面。如果頁面有很好的反向鏈接,并且產(chǎn)品有更新或改進(jìn)的版本,您可能需要考慮保留頁面以保留反向鏈接權(quán)益。為此,請更新頁面內(nèi)容以解釋產(chǎn)品不再可用的原因,包括介紹新的設(shè)計(jì)功能和鏈接到新產(chǎn)品頁面。這樣,用戶就不會(huì)登陸完全不相關(guān)的頁面或404。

4.定期進(jìn)行現(xiàn)場審核

通過每月運(yùn)行審核,您可以隨時(shí)掌握任何可能從裂縫中溜走的意外孤立頁面。您可以使用Ahrefs的站點(diǎn)審核中的調(diào)度功能輕松完成此操作。

寫在最后

查看成排的孤立頁面錯(cuò)誤并試圖理解沉重的技術(shù)術(shù)語是令人生畏的。雖然查找和修復(fù)孤立頁面需要大量時(shí)間,但并不需要很辛苦。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來源:數(shù)聚梨海外營銷獨(dú)立站跨境電商
版權(quán)說明:本文內(nèi)容來自于數(shù)聚梨海外營銷獨(dú)立站跨境電商,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號(hào)登錄/注冊
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家