一区二区三区高清不卡视频-99|亚洲 日韩 欧美 一区 成人|一本久久道亚洲综合|国产高清无码入口|午夜亚洲视频国产|国产亚洲午夜嘿嘿视频|97人妻一区二区三区免费九一视频|久久精品一区99|久久久精品久久久欧美俄罗乱妇|玖玖中文字幕AV

歡迎訪問士人網絡天水網站建設專業(yè)服務平臺 網站地圖 | 聯(lián)系我們
天水網站建設制作設計公司【天水士人網絡】
當前位置:首頁 > 網站優(yōu)化 > 優(yōu)化知識 > 正文

搜索引擎是怎么工作的?簡析搜索引擎的基本工作原理

時間:2013-11-02 | 來源:士人網絡 | 關注: 818

    搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的網絡系統(tǒng)。通俗地說,搜索引擎就是指自動從英特網搜集信息,經過一定整理以后,提供給用戶進行查詢的系統(tǒng)。

    Google目前被公認為是全球規(guī)模最大的并且也是最受歡迎的搜索引擎,據(jù)統(tǒng)計,截止2013年,谷歌的全球市場份額在60%以上,是搜索引擎的代表。國內搜索引擎老大百度則排在第二位,占全球市場份額的10%左右,雅虎排第三,占5%左右。排在第四的是來自俄羅斯的Yandex搜索,份額為3左右%。微軟的必應搜索被擠到第五位,份額為2.5%。

    目前世界上擁有其獨立的搜索引擎的只有4個國家,他們分別是美國(Google)、中國(Baidu)、俄羅斯 (Yandex)、韓(Naver),其余的國家所使用的搜索引擎均是Google。

    搜索引擎是怎么工作的?搜索引擎的基本工作原理包括以下三個步驟:首先在互聯(lián)網中發(fā)現(xiàn)、搜集網頁信息,緊接著對信息進行提取和組織建立索引數(shù)據(jù)庫;再由檢索器根據(jù)用戶輸入的查詢關鍵字,在索引庫中快速檢出文檔,并對將要輸出的結果進行排序,并將查詢結果返回給用戶。

    1、抓取網頁。每個獨立的搜索引擎都有自己的網頁抓取程序爬蟲(spider)。爬蟲Spider順著網頁中的超鏈接,從這個網站爬到另一個網站,通過超鏈接分析連續(xù)訪問抓取更多網頁。被抓取的網頁被稱之為網頁快照。由于互聯(lián)網中超鏈接的應用很普遍,理論上,從一定范圍的網頁出發(fā),就能搜集到絕大多數(shù)的網頁。

    2、處理網頁。搜索引擎抓到網頁后,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引庫。其他還包括去除重復網頁、判斷網頁類型、分析超鏈接、計算網頁的重要度和豐富度等。

    3、提供檢索服務。用戶輸入關鍵詞進行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關鍵詞的網頁,為了用戶便于判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息。

    前面我們提到了一個詞“超鏈接分析”,百度總裁李彥宏是這項技術的唯一持有人,而且該技術已經被全世界的各大搜索引擎普遍采用了。我們如何來理解超鏈分析技術呢? 簡單來講,判斷某個網頁是否優(yōu)秀或者權威,其它的頁面的“意見”是非常重要的。即便一個網頁并不那么優(yōu)秀,但是只要其他網頁對它的“信任投票”(反向鏈接)超過了其它頁面,那么它的排名也會靠前,甚至排名第一。 比如,在阿里巴巴(www.alibaba.com)的網站上,整個網站都沒有“國際站”這個詞的出現(xiàn),但是它在“國際站”這個詞的排名上卻非常好,原因就是阿里巴巴旗下的數(shù)量龐大的網頁都給了它一個“信任投票”(錨文本)。 需要注意的是,“超鏈分析”只是排名的一個重要參考,但不是唯一參考。

相關熱詞搜索: 搜索引擎是怎么工作的,搜索引擎的基本工作原理