這是SEO基礎(chǔ)知識第2篇:搜索引擎是如何工作的?
那么,什么是搜索引擎?它是如何工作的呢?今天,我們了解下搜索引擎的基本運作原理。
什么是搜索引擎?
簡單來說,搜索引擎是一種在線查找工具,幫助我們在互聯(lián)網(wǎng)上找到想要的信息。
提到搜索引擎,大家可能首先想到的是谷歌(Google)。
谷歌(Google)在全球搜索引擎市場中占據(jù)了很大的份額,可以說是最受歡迎的搜索引擎之一。
來源:statcounter
但是,除了谷歌,市面上還有很多其他的搜索引擎,但它們的工作原理大致相同。
搜索引擎如何工作?
要提升網(wǎng)站在搜索引擎中的排名,首先要了解搜索引擎是如何工作的?
每個搜索引擎都有自己獨特的算法,我們以谷歌為例,了解它的工作機(jī)制。
谷歌(Google)的搜索引擎工作流程可以分為三個主要步驟:
1.抓取
首先,谷歌需要找到互聯(lián)網(wǎng)上的網(wǎng)頁。
由于網(wǎng)絡(luò)上沒有統(tǒng)一的網(wǎng)頁目錄,谷歌需要通過兩種方式來發(fā)現(xiàn)新網(wǎng)頁:
鏈接發(fā)現(xiàn):如果一個網(wǎng)頁被其他網(wǎng)頁鏈接,谷歌就可以順著這些鏈接找到新的頁面。
網(wǎng)站主動提交:網(wǎng)站管理員可以通過提交網(wǎng)站地圖,告訴谷歌哪些網(wǎng)頁需要被抓取。
一旦谷歌發(fā)現(xiàn)了網(wǎng)頁,它就會派出Googlebot(也叫爬蟲或蜘蛛)來訪問這些頁面。
爬蟲就像一個網(wǎng)頁閱讀器,能夠讀取并解析網(wǎng)頁內(nèi)容。
不過,要注意在抓取過程中,Googlebot有時會遇到一些問題,導(dǎo)致我們的網(wǎng)頁無法被抓取。
比如
-我們的網(wǎng)站服務(wù)器可能出現(xiàn)故障
-我們的網(wǎng)絡(luò)連接可能不穩(wěn)
-或者網(wǎng)站設(shè)置了訪問限制
這就是谷歌(Google)如何發(fā)現(xiàn)和了解網(wǎng)頁內(nèi)容的第一步。
2.索引
抓取網(wǎng)頁后,谷歌(Google)會對網(wǎng)頁進(jìn)行分析,理解頁面的內(nèi)容。這一過程稱為索引。
谷歌(Google)會讀取網(wǎng)頁的標(biāo)題、正文、圖片、視頻等信息,并處理網(wǎng)頁上的關(guān)鍵詞和其他重要元素。
同時,谷歌(Google)還會記錄很多關(guān)于網(wǎng)頁的信息,比如:
這個網(wǎng)頁是用什么語言寫的
是針對哪個國家或地區(qū)的用戶
網(wǎng)頁在不同設(shè)備上是否好用
這些收集到的信息會被存儲在谷歌(Google)的大型數(shù)據(jù)庫中。
但并不是所有的網(wǎng)頁都會被索引,以下情況可能導(dǎo)致我們的網(wǎng)頁被排除在外:
-內(nèi)容質(zhì)量較差;
-網(wǎng)站明確標(biāo)明不希望被索引;
-網(wǎng)站設(shè)計問題,導(dǎo)致谷歌無法理解頁面內(nèi)容。
簡單來說,這個階段就是谷歌(Google)在理解和整理它找到的網(wǎng)頁內(nèi)容,為之后能在搜索結(jié)果中展示這些內(nèi)容做準(zhǔn)備。
3.呈現(xiàn)搜索結(jié)果
當(dāng)我們或者用戶在搜索框輸入內(nèi)容時,谷歌(Google)會根據(jù)很多因素來決定向我們展示什么結(jié)果:
會考慮我們在哪里搜索
用的是什么語言
是用手機(jī)還是電腦在搜索
比如說,同樣搜索"自行車維修店",在北京和在廣州看到的結(jié)果肯定是不一樣的。
搜索結(jié)果的展示方式也會根據(jù)搜索內(nèi)容的不同而改變。有時候會顯示地圖,有時候會顯示圖片,這都取決于谷歌(Google)判斷什么樣的展示方式最適合我們的搜索需求。
有時候一個網(wǎng)頁雖然已經(jīng)被Google收錄了,但在搜索結(jié)果中卻看不到,主要有這么幾個原因:
-這個網(wǎng)頁的內(nèi)容跟搜索的內(nèi)容不相關(guān)
-網(wǎng)頁內(nèi)容質(zhì)量不夠好
-網(wǎng)站設(shè)置了不允許展示的規(guī)則
總的來說,這個過程是自動的,也是動態(tài)變化的,目的是為了給用戶提供最好的搜索體驗。
總結(jié)一下,Google的工作過程就是這樣:
先抓取網(wǎng)頁,再對網(wǎng)頁進(jìn)行索引,然后根據(jù)我們的搜索請求選出最相關(guān)的結(jié)果展示給我們。