搜索引擎指自動(dòng)從英特網(wǎng)搜集信息,經(jīng)過(guò)一定整理以后,提供給用戶進(jìn)行查詢的系統(tǒng)。英特網(wǎng)上的信息浩瀚萬(wàn)千,而且毫無(wú)秩序,所有的信息象汪洋上的一個(gè)個(gè)小島,網(wǎng)頁(yè)鏈接是這些小島之間縱橫交錯(cuò)的橋梁,而搜索引擎,則為你繪制一幅一目了然的信息地圖,供你隨時(shí)查閱。
搜索引擎的工作原理大致可以分為:
1、搜集信息:搜索引擎的信息搜集基本都是自動(dòng)的。搜索引擎利用稱為網(wǎng)絡(luò)蜘蛛(spider)的自動(dòng)搜索機(jī)器人程序來(lái)連上每一個(gè)網(wǎng)頁(yè)上的超連結(jié)。機(jī)器人程序根據(jù)網(wǎng)頁(yè)鏈到其他中的超鏈接,就象日常生活中所說(shuō)的“一傳十,十傳百……”一樣,從少數(shù)幾個(gè)網(wǎng)頁(yè)開始,連到數(shù)據(jù)庫(kù)上所有到其他網(wǎng)頁(yè)的鏈接。理論上,若網(wǎng)頁(yè)上有適當(dāng)?shù)某B結(jié),機(jī)器人便可以遍歷絕大部分網(wǎng)頁(yè)。
2、整理信息:搜索引擎整理信息的過(guò)程稱為“建立索引”。搜索引擎不僅要保存搜集起來(lái)的信息,還要將它們按照一定的規(guī)則進(jìn)行編排。這樣,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的資料。想象一下,如果信息是不按任何規(guī)則地隨意堆放在搜索引擎的數(shù)據(jù)庫(kù)中,那么它每次找資料都得把整個(gè)資料庫(kù)完全翻查一遍,如此一來(lái)再快的計(jì)算機(jī)系統(tǒng)也沒有用。
3、接受查詢:用戶向搜索引擎發(fā)出查詢,搜索引擎接受查詢并向用戶返回資料。搜索引擎每時(shí)每刻都要接到來(lái)自大量用戶的幾乎是同時(shí)發(fā)出的查詢,它按照每個(gè)用戶的要求檢查自己的索引,在極短時(shí)間內(nèi)找到用戶需要的資料,并返回給用戶。目前,搜索引擎返回主要是以網(wǎng)頁(yè)鏈接的形式提供的,這些通過(guò)這些鏈接,用戶便能到達(dá)含有自己所需資料的網(wǎng)頁(yè)。通常搜索引擎會(huì)在這些鏈接下提供一小段來(lái)自這些網(wǎng)頁(yè)的摘要信息以幫助用戶判斷此網(wǎng)頁(yè)是否含有自己需要的內(nèi)容。