????? 確實,搜索引擎是網(wǎng)絡(luò)推廣的一個非常強大的武器,而且免費——但是我們首先必須了解它們。
?????? 我們要了解它們是如何工作、如何分類、如何查詢……的,而且搜索引擎就像人一樣各不相同,所以對于特別重要的引擎,我們還需要了解它們的個性。
?????? 1、兩個最基本的詞匯:搜索引擎(Search Engine):通過運行一個軟件,該軟件在網(wǎng)絡(luò)上通過各種鏈接,自動獲得大量站點頁面的信息,并按照一定規(guī)則進行歸類整理,從而形成數(shù)據(jù)庫,以備查詢。這樣的站點(獲得信息==>整理建立數(shù)據(jù)庫==>提供查詢)我們就稱之為“搜索引擎”。而所使用的軟件一般叫做“Spider”、“crawlers”等。分類目錄(Directory):通過“人工方式”將站點進行分類而建立數(shù)據(jù)庫,以提供查詢,這樣的站點叫著“分類目錄”。典型的搜索引擎如AltaVista、Excite、HotBot、Inktomi等,而最重要的分類目錄就是Yahoo。
?????? 實際上無論“搜索引擎”還是“分類目錄”,目標都一樣:獲得網(wǎng)站資料,建立數(shù)據(jù)庫提供查詢。只不過使用的方法不同。
?????? “搜索引擎”因為依靠軟件自動進行,因此,其數(shù)據(jù)庫的容量非常龐大,但是伴隨著查詢結(jié)果往往不夠精確;而“分類目錄”由于依靠人工分類,查詢得到的信息要準確些,但收集的內(nèi)容非常有限。
?????? 我們平時把這兩類統(tǒng)稱為“搜索引擎”,在下面的討論中我們將以“自動”的搜索引擎為主,至于“人工”的如Yahoo,我將會在“中文Yahoo”中單獨討論。
?????? 2、主要的搜索引擎:
?????? 七個最主要的搜索引擎及各自包括的頁面數(shù):引擎AltaVistaNorthernLightInktomiExciteLycosInfoseekWebCrawler頁面數(shù)(百萬頁)1501251105550452(以上數(shù)據(jù)為1999年2月1日統(tǒng)計值)
?????? 3、搜索引擎工作的三步:
?????? 第一步是“Spider”軟件訪問一個站點,并通過其中的鏈接閱讀該站點的頁面,而且“Spider”會不時的自動回訪該站點以檢查變化情況;該“Spider”獲得的站點信息形成一個巨大的網(wǎng)絡(luò)信息庫,如同整個網(wǎng)絡(luò)上已經(jīng)訪問站點的備份,當然記錄的不是所有的內(nèi)容。這也就是我們所說的數(shù)據(jù)庫。第三步是查詢服務(wù)。這是通過查詢軟件實現(xiàn)的,當你輸入查詢內(nèi)容,該軟件就會在其數(shù)據(jù)庫中找到相關(guān)內(nèi)容,然后按照“它的”規(guī)則進行排序。
?????? 4、搜索引擎在查詢時是如何排名的:最主要是根據(jù)一個站點的內(nèi)容與查詢詞的關(guān)聯(lián)程度,但是一個站點的內(nèi)容搜索引擎又是如何確定的呢?——標題(Title)、關(guān)鍵詞(Keywords)、描述(Description)、頁面開始部分的內(nèi)容以及這些內(nèi)容本身之間的關(guān)聯(lián)程度。而且現(xiàn)在絕大部分搜索引擎都支持MetaTag。
?????? 另一個主要因素是一個站點在整個網(wǎng)絡(luò)上的關(guān)聯(lián)程度,也就是說一個站點在網(wǎng)絡(luò)中其他站點出現(xiàn)的次數(shù)(LinkPopularity)。
?????? 雖然不同的搜索引擎有各自的“游戲規(guī)則”,但是請記住“關(guān)聯(lián)程度”這個詞,包括站內(nèi)和站外的