1 Google成為目前最受歡迎的搜索引擎
Google(WWW.Google.com)是當(dāng)今一個(gè)優(yōu)秀的搜索引擎,其功能強(qiáng)大、特點(diǎn)突出、技術(shù)先進(jìn)和服務(wù)優(yōu)良,它在業(yè)界評(píng)測(cè)中獲得多項(xiàng)大獎(jiǎng),各大引擎競(jìng)相模仿其功能和特色。Google非中國(guó)本土公司,但它支持中文搜索,其中文搜索引擎是收集亞洲網(wǎng)站最多的搜索引擎之一,國(guó)內(nèi)使用其獨(dú)立搜索引擎的人數(shù)急劇增長(zhǎng)。
目前,全世界訪問(wèn)量最大的4個(gè)網(wǎng)站中,3家采用了Google的搜索技術(shù),80%的互聯(lián)網(wǎng)搜索是通過(guò)Google或使用Google技術(shù)的網(wǎng)站完成的。目前Google每個(gè)月接待來(lái)自世界各地的超過(guò)2800萬(wàn)獨(dú)立訪問(wèn)者,全球網(wǎng)民通過(guò)Google可以使用86種語(yǔ)言,搜索30多億個(gè)網(wǎng)頁(yè)及其網(wǎng)頁(yè)快照,以及4億多張圖片,每個(gè)月Google被用戶(hù)使用的時(shí)間為1500萬(wàn)小時(shí)左右。
據(jù)搜索引擎觀察者網(wǎng)絡(luò)雜志統(tǒng)計(jì)結(jié)果顯示,至2002年10月份,網(wǎng)民使用Google的時(shí)間量每月達(dá)到1610萬(wàn)小時(shí);相比之下,雅虎只吸引了660萬(wàn)小時(shí),微軟 MSN僅有520萬(wàn)小時(shí)[3]。
2 利用Google進(jìn)行專(zhuān)題信息檢索的方法和技巧
關(guān)鍵詞檢索功能是網(wǎng)絡(luò)信息檢索工具的基本檢索功能,也是Google最基本的檢索功能。關(guān)鍵詞屬于自然語(yǔ)言,靈活、不受詞表控制,但簡(jiǎn)單的關(guān)鍵詞檢索方法,命中過(guò)多,查準(zhǔn)率很低,Google為改善關(guān)鍵詞檢索性能,提供了按相關(guān)度排列結(jié)果、布爾邏輯檢索,短語(yǔ)或者句子檢索、加權(quán)檢索和限制檢索等增強(qiáng)措施。
利用Google進(jìn)行專(zhuān)題信息檢索,為提高查準(zhǔn)率,須認(rèn)真分析課題,選擇恰當(dāng)?shù)年P(guān)鍵詞,掌握和運(yùn)用Google檢索語(yǔ)法規(guī)則,準(zhǔn)確設(shè)計(jì)表達(dá)需求的檢索式,反復(fù)調(diào)整檢索策略,才能獲得高質(zhì)量的檢索結(jié)果。
2.1 簡(jiǎn)單專(zhuān)題信息檢索,最直截了當(dāng)就是在搜索框內(nèi)輸入一個(gè)關(guān)鍵詞,然后點(diǎn)擊下面的“Google搜索”按鈕(或者直接回車(chē)),結(jié)果就出來(lái)了。
如果檢索人員或用戶(hù)對(duì)查詢(xún)的領(lǐng)域熟悉,只想尋找某些專(zhuān)題網(wǎng)站,首先考慮用目錄檢索,Google根據(jù)其專(zhuān)業(yè)的“網(wǎng)頁(yè)級(jí)別”(PageRank)技術(shù)對(duì)目錄中登錄的網(wǎng)站進(jìn)行了排序,可以使檢索具更高效率,按所需主題確定沿某類(lèi)層層查找網(wǎng)站,目錄分類(lèi)明確,網(wǎng)站專(zhuān)題信息集中,剔除了大量不相關(guān)的信息,不過(guò)對(duì)查找中文信息,Google的中文目錄太少,只有非常普通簡(jiǎn)單的類(lèi)目,可能很難滿足要求。
2.2 熟練掌握Google的基本搜索:+,-,OR ,學(xué)會(huì)使用兩個(gè)關(guān)鍵字進(jìn)行復(fù)雜專(zhuān)題信息檢索
檢索復(fù)雜專(zhuān)題依靠單個(gè)關(guān)鍵詞查準(zhǔn)率很低,要提高查全檢準(zhǔn)率,需進(jìn)行詳細(xì)的主題分析,選擇多個(gè)關(guān)鍵詞構(gòu)造檢索式。要分清主要概念和次要概念,去掉被隱含了的概念,確定需要排除的某些概念和不宜選用的泛指概念,以便在制定檢索策略時(shí)有所側(cè)重,保證檢索提問(wèn)的確切表達(dá)。
正確選擇關(guān)鍵詞,各種類(lèi)型的檢索課題對(duì)檢索的查全率和查準(zhǔn)率有著不同的要求,可以增加上位概念或下位概念的方法來(lái)擴(kuò)檢[4],若查準(zhǔn)率要求較高,應(yīng)使用專(zhuān)指性較強(qiáng)的概念或增加限制概念來(lái)縮小檢索范圍,還可通過(guò)對(duì)字段進(jìn)行限定的方式來(lái)保證查找的準(zhǔn)確性。對(duì)于那些對(duì)查全率和查準(zhǔn)率無(wú)特殊要求的用戶(hù)來(lái)說(shuō),也要針對(duì)不同的課題,制定相應(yīng)的檢索策略。
對(duì)文獻(xiàn)量較大或?qū)儆诔墒鞂W(xué)科的課題,應(yīng)優(yōu)先考慮查準(zhǔn)率,從眾多的相關(guān)文獻(xiàn)中選取針對(duì)性較強(qiáng)的文獻(xiàn)。對(duì)文獻(xiàn)較少或新興學(xué)科的課題,可適當(dāng)放寬檢索范圍來(lái)保證查全率,以免遺漏重要的參考文獻(xiàn)。
選擇正確的關(guān)鍵詞后,就要運(yùn)用Google檢索語(yǔ)法規(guī)則構(gòu)建檢索式。
Google無(wú)需用明文的“+”來(lái)表示邏輯“與”操作,只要空格就可以了。
示例:搜索所有包含關(guān)鍵詞“易筋經(jīng)”和“吸星大法”的中文網(wǎng)頁(yè)
搜索式:“易筋經(jīng) 吸星大法”(注意:文章中搜索語(yǔ)法外面的引號(hào)僅起引用作用,不能帶入搜索欄內(nèi)。)
Google用減號(hào)“-”表示邏輯“非”操作。
示例:搜索所有包含“易筋經(jīng)”而不含“吸星大法”的中文網(wǎng)頁(yè)
搜索式:“易筋經(jīng) -吸星大法”(注意:這里的“+”和“-”號(hào),是英文字符,而不是中文字符的“+”和“-”。此外,操作符與作用的關(guān)鍵字之間,不能有空格。比如“易筋經(jīng) - 吸星大法”,搜索引擎將視為邏輯“與”操作,中間的“-”被忽略。)
Google用大寫(xiě)的“OR”表示邏輯“或”操作( 注意:小寫(xiě)的“or”,在查詢(xún)的時(shí)候?qū)⒈缓雎裕贿@樣上述的操作實(shí)際上變成了一次“與”查詢(xún))。但是,關(guān)鍵字為中文的或查詢(xún)似乎還有BUG,無(wú)法得到正確的查詢(xún)結(jié)果。
示例:搜索包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網(wǎng)頁(yè)。
搜索式:“britney OR beatles”
結(jié)果:已搜索有關(guān)britney OR beatles的中文(簡(jiǎn)體)網(wǎng)頁(yè)。共約有14,600項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.08秒。
搜索式:“布蘭妮 OR 披頭士”
結(jié)果:找不到和您的查詢(xún)-布蘭妮 OR 披頭士-相符的網(wǎng)頁(yè)。
“+”和“-”的作用有的時(shí)候是相同的,都是為了縮小搜索結(jié)果的范圍,提高查詢(xún)結(jié)果命中率。
例:查閱天龍八部具體是哪八部?!?br />分析:如果光用“天龍八部”做關(guān)鍵字,搜索結(jié)果有26,500項(xiàng),而且排前列的主要與金庸的小說(shuō)《天龍八部》相關(guān),很難找到所需要的信息。可以用兩個(gè)方法減少無(wú)關(guān)結(jié)果。
( 1)、如果你知道八部中的某一部,比如阿修羅,增加“阿修羅”關(guān)鍵字,如“天龍八部 阿修羅”。搜索結(jié)果就只有995項(xiàng),可以直接找到全部八部?!?br />( 2)、如果你不知道八部中的任何一部,但知道這與佛教相關(guān),可以排除與金庸小說(shuō)相關(guān)的記錄,如“天龍八部 佛教 -金庸”。查詢(xún)結(jié)果為1,010項(xiàng),可以迅速找到需要的資料。
2.3 熟悉Google的輔助搜索方法:通配符、大小寫(xiě)、句子、忽略字符以及強(qiáng)制搜索 [5]
Google不支持通配符,如“*”、“?”等,只能做精確查詢(xún),關(guān)鍵字后面的“*”或者“?”會(huì)被忽略掉?!?br />Google對(duì)英文字符大小寫(xiě)不敏感,“GOD”和“god”搜索的結(jié)果是一樣的。
Google的關(guān)鍵字可以是詞組(中間沒(méi)有空格),也可以是句子(中間有空格),但是,用句子做關(guān)鍵字,必須加英文引號(hào)。
示例:搜索包含“l(fā)ong, long ago”字串的頁(yè)面。
搜索式:““l(fā)ong, long ago“”
結(jié)果:已向英特網(wǎng)搜索“l(fā)ong, long ago“. 共約有28,300項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.28秒?!?br />注意:和搜索英文關(guān)鍵字串不同的是,Google對(duì)中文字串的處理并不十分完善。比如,搜索““啊,我的太陽(yáng)“”,我們希望結(jié)果中含有這個(gè)句子,事實(shí)并非如此。查詢(xún)的很多結(jié)果,“啊”、“我的”、“太陽(yáng)”等詞語(yǔ)是完全分開(kāi)的,但又不是“啊 我的 太陽(yáng)”這樣的與查詢(xún)。
Google對(duì)一些網(wǎng)絡(luò)上出現(xiàn)頻率極高的詞(主要是英文單詞),如“i”、“com”,以及一些符號(hào)如“*”、“.”等,作忽略處理,如果用戶(hù)必須要求關(guān)鍵字中包含這些常用詞,就要用強(qiáng)制語(yǔ)法“+”。
示例:搜索包含“Who am I ?”的網(wǎng)頁(yè)。如果用““who am i ?“”,“Who”、“I”、“?”會(huì)被省略掉,搜索將只用“am”作關(guān)鍵字,所以應(yīng)該用強(qiáng)制搜索。
搜索式:““+who +am +i“”(注意:英文符號(hào)(如問(wèn)號(hào),句號(hào),逗號(hào)等)無(wú)法成為搜索關(guān)鍵字,加強(qiáng)制也不行 )
結(jié)果:已向英特網(wǎng)搜索“+who +am +i“. 共約有362,000項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.30秒。
2.4 了解Google的高級(jí)搜索語(yǔ)法:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索結(jié)果局限于某個(gè)具體網(wǎng)站或者網(wǎng)站頻道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某個(gè)域名,如“com.cn”、“com”等等。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁(yè)面,只需用“-網(wǎng)站/域名”?!?br />示例:搜索中文教育科研網(wǎng)站(edu.cn)上所有包含“金庸”的頁(yè)面。
搜索式:“金庸 site:edu.cn”
示例:搜索包含“金庸”和“古龍”的中文新浪網(wǎng)站頁(yè)面,
搜索式:“金庸 古龍 site:sina.com.cn”
結(jié)果:已在sina.com.cn搜索有關(guān)金庸 古龍的中文(簡(jiǎn)體)網(wǎng)頁(yè)。共約有869項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.34秒。
注意:site后的冒號(hào)為英文字符,而且,冒號(hào)后不能有空格,否則,“site:”將被作為一個(gè)搜索的關(guān)鍵字。此外,網(wǎng)站域名不能有“http”以及“www”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。諸如“金庸 site:edu.sina.com.cn/1/”的語(yǔ)法是錯(cuò)誤的。
使用“l(fā)ink”語(yǔ)法,將搜索到所有鏈接到某個(gè)URL地址的網(wǎng)頁(yè)?!?br />示例:搜索所有含指向華軍軟件園“www.newhua.com”鏈接的網(wǎng)頁(yè)。
搜索式:“l(fā)ink:www.newhua.com”
注意:“l(fā)ink”不能與其他語(yǔ)法相混合操作,所以“l(fā)ink:”后面即使有空格,也將被Google忽略。
使用inurl語(yǔ)法,返回的網(wǎng)頁(yè)鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁(yè)文檔中。有很多網(wǎng)站把某一類(lèi)具有相同屬性的資源名稱(chēng)顯示在目錄名稱(chēng)或者網(wǎng)頁(yè)名稱(chēng)中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語(yǔ)法找到這些相關(guān)資源鏈接,然后,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語(yǔ)法和基本搜索語(yǔ)法的最大區(qū)別在于,前者通常能提供非常精確的專(zhuān)題資料。
示例:查找MIDI曲“滄海一聲笑”。
搜索式:“inurl:midi 滄海一聲笑”
結(jié)果:已搜索有關(guān)inurl:midi 滄海一聲笑的中文(簡(jiǎn)體)網(wǎng)頁(yè)。共約有14項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.01秒。
示例:查找微軟網(wǎng)站上關(guān)于windows2000的安全課題資料。
搜索式:“inurl:security windows2000 site:microsoft.com”
結(jié)果:已在microsoft.com內(nèi)搜索有關(guān) inurl:security windows2000的網(wǎng)頁(yè)。共約有198項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.37秒。
注意:“inurl:”后面不能有空格,Google也不對(duì)URL符號(hào)如“/”進(jìn)行搜索。Google對(duì)“cgi-bin/phf”中的“/”當(dāng)成空格處理。
使用allinurl語(yǔ)法,返回的網(wǎng)頁(yè)鏈接中包含所有查詢(xún)關(guān)鍵字,這個(gè)查詢(xún)的對(duì)象只集中于網(wǎng)頁(yè)的鏈接字符串。
示例:查找可能具有PHF安全漏洞的公司網(wǎng)站。通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序(這個(gè)腳本是不安全的),表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”。
搜索式:“allinurl:“cgi-bin“ phf +com”
結(jié)果:已向英特網(wǎng)搜索allinurl:“cgi-bin“ phf +com. 共約有40項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.06秒?!?br />allintitle和intitle的用法類(lèi)似于上面的allinurl和inurl,只是后者對(duì)URL進(jìn)行查詢(xún),而前者對(duì)網(wǎng)頁(yè)的標(biāo)題欄進(jìn)行查詢(xún)。網(wǎng)頁(yè)標(biāo)題,就是HTML標(biāo)記語(yǔ)言title中之間的部分。網(wǎng)頁(yè)設(shè)計(jì)的一個(gè)原則就是要把主頁(yè)的關(guān)鍵內(nèi)容用簡(jiǎn)潔的語(yǔ)言表示在網(wǎng)頁(yè)標(biāo)題中。因此,只查詢(xún)標(biāo)題欄,通常也可以找到高相關(guān)率的專(zhuān)題頁(yè)面。
示例:查找日本明星藤原紀(jì)香的照片集。
搜索式:“intitle:藤原紀(jì)香 寫(xiě)真”
結(jié)果:已搜索有關(guān)intitle:藤原紀(jì)香 寫(xiě)真的中文(簡(jiǎn)體)網(wǎng)頁(yè)。共約有284項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.03秒。
2.5 Google的罕用高級(jí)搜索語(yǔ)法:related,cache,info
related用來(lái)搜索結(jié)構(gòu)內(nèi)容方面相似的網(wǎng)頁(yè)。例:搜索所有與中文新浪網(wǎng)主頁(yè)相似的頁(yè)面(如網(wǎng)易首頁(yè),搜狐首頁(yè),中華網(wǎng)首頁(yè)等),“related:www.sina.com.cn/index.shtml”。
cache用來(lái)搜索Google服務(wù)器上某頁(yè)面的緩存,這個(gè)功能同“網(wǎng)頁(yè)快照”,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁(yè),相當(dāng)于使用普通搜索結(jié)果頁(yè)面中的“網(wǎng)頁(yè)快照”功能。
info用來(lái)顯示與某鏈接相關(guān)的一系列搜索,提供cache、link、related和完全包含該鏈接的網(wǎng)頁(yè)的功能。
示例:查找和新浪首頁(yè)相關(guān)的一些資訊。
搜索式:“info:www.sina.com.cn”
3 Google的其他重要功能介紹
目錄服務(wù) 如果不想搜索網(wǎng)頁(yè),而是想尋找某些專(zhuān)題網(wǎng)站,可以訪問(wèn)Google的分類(lèi)目http://directory.Google.com/”,中文目錄http://directory.Google.com/Top/World/Chinese_Simplified/”。不過(guò)由于Google的目錄由志愿者服務(wù),而GOOGLE在國(guó)內(nèi)名氣相對(duì)比較小,因此中文目錄下收錄站點(diǎn)很少[6]。
工具條 為了方便搜索者,Google提供了工具條,集成于瀏覽器中,用戶(hù)無(wú)需打開(kāi)GOOGLE主頁(yè)就可以在工具條內(nèi)輸入關(guān)鍵字進(jìn)行搜索。此外,工具條還提供了其他許多功能,如顯示頁(yè)面PageRank、設(shè)置攔截彈出廣告等。最方便的一點(diǎn)在于用戶(hù)可以快捷的在Google主頁(yè)、目錄服務(wù)、新聞組搜索、高級(jí)搜索和搜索設(shè)定之間切換。目前Google主頁(yè)已提示下載安裝Google工具條。
新聞組(USENET)搜索 新聞組中有大量的有價(jià)值信息,DEJA一直是新聞組搜索引擎中的佼佼者。2001年2月份,Google將DEJA收購(gòu)并提供了所有DEJA的功能?,F(xiàn)在,除了搜索之外,Google還支持新聞組的WEB方式瀏覽和張貼功能。輸http://groups.Google.com/”后,便進(jìn)入Google新聞組界面。可惜現(xiàn)在還沒(méi)有中文界面。新聞組高級(jí)搜索界面提供對(duì)關(guān)鍵字、新聞組、主題、作者、帖子序號(hào)、語(yǔ)言和發(fā)布日期的條件搜索。其中作者項(xiàng)指作者發(fā)帖所用的唯一識(shí)別號(hào)電子信箱。比如要在alt.chinese.text內(nèi)搜索著名老牌網(wǎng)絡(luò)寫(xiě)手圖雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不過(guò)一般而言,更推薦使用圖形搜索界面,方便而且直觀。
搜索結(jié)果翻譯 曾經(jīng)為那些你不懂的法文、西班牙文頁(yè)面煩惱么?現(xiàn)在,Google支持一項(xiàng)搜索結(jié)果翻譯功能,可以把非英文的搜索結(jié)果翻譯成英文?。∧壳爸恢С钟邢薜睦≌Z(yǔ)、法語(yǔ)、西班牙語(yǔ)、德語(yǔ)和葡萄牙文。只能在英文狀態(tài)Google下實(shí)現(xiàn)這個(gè)功能。進(jìn)入Google的設(shè)置頁(yè)http://www.Google.com/preferences,有一個(gè)“BETA: Enable translation of search results into your interface language. ”的選項(xiàng),把它選中,就OK了。
搜索結(jié)果過(guò)濾 網(wǎng)絡(luò)上的成人內(nèi)容浩如煙海,而且很多站點(diǎn)具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,Google新設(shè)立了成人內(nèi)容過(guò)濾功能,見(jiàn)Google的設(shè)置頁(yè)http://www.Google.com/preferences,最底下有一個(gè)選項(xiàng)SafeSearch Filtering。不過(guò),中文狀態(tài)下的Google尚沒(méi)有這個(gè)功能。
PDF文檔搜索 Google提供對(duì)PDF文檔內(nèi)文的檢索。目前Google檢索的PDF文檔大約有2500萬(wàn)左右。PDF是ADOBE公司開(kāi)發(fā)的電子文檔格式,現(xiàn)在已經(jīng)成為互聯(lián)網(wǎng)的電子化出版標(biāo)準(zhǔn)。PDF文檔通常是一些圖文并茂的綜合性文檔,提供的資訊一般比較集中全面?!?br />示例:搜索關(guān)于電子商務(wù)(ECOMMERCE)的PDF文檔。
搜索式:“inurldf ecommerce”
下面是某項(xiàng)搜索結(jié)果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product Marketing Professonial (PMP) Implementation Manager, Web Engineering ... 一般文字檔 - 類(lèi)似網(wǎng)頁(yè)
可以看到,Google在PDF檔前加上了[PDF]的標(biāo)記,而且,Google把PDF文件轉(zhuǎn)換成了文字檔,點(diǎn)擊“一般文字檔”,可以粗略的查看該P(yáng)DF文檔的大致內(nèi)容。當(dāng)然,PDF原有的圖片以及格式是沒(méi)有了。
圖像文檔搜索 Google提供了Internet上圖像文件的搜索功能!!地址是“images.Google.com”。你可以在關(guān)鍵字欄位內(nèi)輸入描述圖像內(nèi)容的關(guān)鍵字,如“劉德華”。 Google給出的搜索結(jié)果具有一個(gè)直觀的縮略圖,以及對(duì)該縮略圖的簡(jiǎn)單描述,如圖像文件名稱(chēng),以及大小等。點(diǎn)擊縮略圖,頁(yè)面分成兩禎,上禎是圖像之縮略圖,以及頁(yè)面鏈接,而下禎,則是該圖像所處的頁(yè)面。屏幕右上角有一個(gè)“移除欄框”的按鈕,可以把框架頁(yè)面迅速切換到單禎的結(jié)果頁(yè)面,非常方便。Google還提供了對(duì)成人內(nèi)容圖像的限制功能,可以讓搜索者免受不必要的騷擾。
4 Google特殊應(yīng)用搜索實(shí)例介紹:
關(guān)鍵詞的選擇在搜索中起到?jīng)Q定性的作用,所有搜索技巧中,關(guān)鍵詞選擇是最基本也是最有效的。
4.1 搜索之前先思考 搜索引擎本事再大,也搜索不到網(wǎng)上沒(méi)有的內(nèi)容,而且,有些內(nèi)容雖然存在網(wǎng)上,卻因?yàn)楦鞣N原因,而成為漏網(wǎng)之魚(yú)。所以在你使用搜索引擎搜索之前,應(yīng)該先花幾秒種想一下,我要找的東西網(wǎng)上可能有嗎?網(wǎng)頁(yè)上會(huì)含有哪些關(guān)鍵字?
例一:查找《鏡花緣》一書(shū)中淑士國(guó)酒保的酸話原文。
分析:如果按照一般的思路,找某部小說(shuō)中的具體段落,就需要用搜索引擎先找到這本書(shū),然后再翻到該段落。這樣做當(dāng)然可以,但是效率很低。如果了解目標(biāo)信息的構(gòu)成,用一些目標(biāo)信息所特有的字詞,可以非常迅速的查到所需要的資料。也就是說(shuō),高效率的搜索,關(guān)鍵字不一定就是目標(biāo)信息的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關(guān)系時(shí),之乎者也橫飛。因此,可以用特定的詞語(yǔ)一下子找到目標(biāo)資料?!?br />搜索:“酒貴賤之”,OK,找到的第一條信息就是鏡花緣的這一段落:“先生聽(tīng)者:今以酒醋論之,酒價(jià)賤之,醋價(jià)貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...” 以上的關(guān)鍵字選擇技巧可以謂之“特定詞法”。
例二:“黃花閨女”一詞中“黃花”是什么意思?!?br />分析:“黃花閨女”是一個(gè)約定的俗語(yǔ),如果只用“黃花閨女 黃花”做關(guān)鍵詞,搜索結(jié)果將浩如煙海,沒(méi)什么價(jià)值,因此必須要加更多的關(guān)鍵詞,約束搜索結(jié)果。選擇什么關(guān)鍵詞好呢?備選的有“意思”、“含義”、“來(lái)歷”、“由來(lái)”、“典故”、“出典”、“淵源”等,可以猜到的是,類(lèi)似的資料,應(yīng)該包含在一些民俗介紹性的文字里,所以用諸如“來(lái)歷”、“由來(lái)”、“出典”等詞匯的概率更高一些。
搜索式:“黃花閨女 黃花 由來(lái)”,查到“黃花”原來(lái)出典于《太平御覽》,與南朝的壽陽(yáng)公主相關(guān)。如果想獲得第一手資料,那就可以用“太平御覽 壽陽(yáng)公主”做搜索了。 以上的關(guān)鍵字選擇技巧可以謂之“近義詞法”。
例三:劉德華的胸圍是多少。
分析:非常直接的搜索是,“劉德華 胸圍”,但事實(shí)上,這么搜索出來(lái)的結(jié)果,盡是一些諸如“劉德華取笑莫文蔚胸圍太小”之類(lèi)的八卦新聞,無(wú)法快速得到所需要的資料??梢韵氲降氖?,需要的資料應(yīng)該包含在劉德華的全面介紹性文字中,除了胸圍,應(yīng)該還包括他的身高,體重,生日等一系列相關(guān)信息。OK,這樣就可以進(jìn)一步的增加其他約束性關(guān)鍵詞以縮小搜索范圍?!?br />搜索式:“劉德華 胸圍 身高”,沒(méi)有料到的情況發(fā)生了,網(wǎng)上炙手可熱的痞子蔡《第一次親密接觸》里居然含有這樣關(guān)鍵字,阿泰“改編自劉德華《忘情水》的變態(tài)歪歌”、“用身高體重三圍和生日來(lái)加以編號(hào)”。好辦,把這部小說(shuō)去掉,“劉德華 胸圍 身高 -阿泰”,OK,結(jié)果出來(lái)了,華仔胸圍84cm。說(shuō)明一下,為什么用“阿泰”而不用“第一次親密接觸”呢?這是因?yàn)樾≌f(shuō)的名字被轉(zhuǎn)載的時(shí)候可能有變動(dòng),但里面角色的名字是不會(huì)變的。
以上的關(guān)鍵字選擇技巧可以謂之“相關(guān)詞法”。
4.2 其他常用搜索個(gè)案
例一:找人 分析:一個(gè)人在網(wǎng)上揭示的資料通常有:姓名,網(wǎng)名,性別,年齡,畢業(yè)學(xué)校,工作單位,外號(hào),住址,電話,信箱,BP,手機(jī)號(hào)碼,ICQ號(hào),OICQ號(hào)等等。所以,如果你要了解一下你多年沒(méi)見(jiàn)過(guò)的同學(xué),那不妨用上述信息做關(guān)鍵字進(jìn)行查詢(xún),也許會(huì)有大的收獲。
例二:找軟件 分析一:最簡(jiǎn)單的搜索當(dāng)然就是直接以軟件名稱(chēng)以及版本號(hào)為關(guān)鍵字查詢(xún)。但是,僅僅有軟件名稱(chēng)和目標(biāo)網(wǎng)站,顯然還不行,因?yàn)樗阉鞯降目赡苁擒浖南嚓P(guān)新聞。應(yīng)該再增加一個(gè)關(guān)鍵字??紤]到下載頁(yè)面上常有“點(diǎn)擊此處下載”或者“download”的提示語(yǔ),因此,可以增加“下載”或者“download”為關(guān)鍵字。
如, 搜索式:“winzip 8.0 下載”
分析二:很多網(wǎng)站設(shè)有專(zhuān)門(mén)的下載目錄,而且就命名為“download”,因此,可以用INURL語(yǔ)法直接搜索這些下載目錄。
搜索式:“winzip 8.0 inurl:download”
在互聯(lián)網(wǎng)上隨意的下載軟件是不安全的,因?yàn)楣┫螺d的軟件有可能帶有病毒或者捆綁了木馬,所以,對(duì)下載網(wǎng)站作一個(gè)限定,是一個(gè)穩(wěn)妥的思路。可以用SITE語(yǔ)法達(dá)到這個(gè)目的。
共享軟件下載完之后,使用的時(shí)候,軟件總跳出警示框,或者軟件的功能受到一定限制。由于中國(guó)的網(wǎng)民多是人,所以應(yīng)該再找一個(gè)注冊(cè)碼。找注冊(cè)碼,除了軟件的名稱(chēng)和版本號(hào)外,還需要有諸如“serial number”、“sn”、“序列號(hào)”等關(guān)鍵字?,F(xiàn)在,來(lái)搜索一下winzip8.0的注冊(cè)碼。
搜索式:“winzip 8.0 sn”
結(jié)果:已向英特網(wǎng)搜索winzip 8.0 sn. 共約有777項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.30秒。
例三:找圖片 除了Google提供的專(zhuān)門(mén)圖片搜索功能,還可以組合使用一些搜索語(yǔ)法,達(dá)到圖片搜索之目的。
分析一:專(zhuān)門(mén)的圖片集合,提供圖片的網(wǎng)站通常會(huì)把圖片放在某個(gè)專(zhuān)門(mén)目錄下,如“gallary”、“album”、“photo”、“image”等。這樣就可以使用INURL語(yǔ)法迅速找到這類(lèi)目錄?,F(xiàn)在,試著找找小甜甜布蘭妮的照片集。
搜索式:““britney spears“ inurlhoto”
結(jié)果:已向英特網(wǎng)搜索“britney spears“ inurlhoto. 共約有2,720項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.23秒。
分析二:提供圖片集合的網(wǎng)頁(yè),在標(biāo)題欄內(nèi)通常會(huì)注明,這是誰(shuí)誰(shuí)的圖片集合。于是就可以用INTITLE語(yǔ)法找到這類(lèi)網(wǎng)頁(yè)。
搜索式:“intitle:“britney spears“ picture”
結(jié)果:已向英特網(wǎng)搜索intitle:“britney spears“ picture. 共約有317項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.40秒。
分析三:明星的FANS通常會(huì)申請(qǐng)免費(fèi)個(gè)人主頁(yè)來(lái)存放他們偶像的靚照。于是用SITE語(yǔ)法指定某免費(fèi)主頁(yè)提供站點(diǎn),是個(gè)迅速找到圖片的好辦法。
搜索式:““britney spears“ site:geocities.com”
結(jié)果:已在geocities.com內(nèi)搜索有關(guān)“britney spears“的網(wǎng)頁(yè)。共約有5,020項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.47秒。
例四:找MP3 分析一:提供MP3的網(wǎng)站,通常會(huì)建立一個(gè)叫做MP3的目錄,目錄底下分門(mén)別類(lèi)的存放各種MP3樂(lè)曲。所以,可以用INURL語(yǔ)法迅速找到這類(lèi)目錄?,F(xiàn)在用這個(gè)辦法找找老歌“say you say me”。
搜索:““say you say me“ inurl:mp3”
結(jié)果:已向英特網(wǎng)搜索inurl:mp3 “say you say me“. 共約有155項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.17秒。
分析二:也可以通過(guò)網(wǎng)頁(yè)標(biāo)題,找到這類(lèi)提供MP3的網(wǎng)頁(yè)。
搜索式:““say you say me“ intitle:mp3”
結(jié)果:已向英特網(wǎng)搜索“say you say me“ intitle:mp3. 共約有178項(xiàng)查詢(xún)結(jié)果,這是第1-10項(xiàng)。搜索用時(shí)0.73秒。
當(dāng)然,如果你知道某個(gè)網(wǎng)站的下載速度快,而且樂(lè)曲全,就可以用SITE語(yǔ)法先到該網(wǎng)站上看看有沒(méi)有目標(biāo)樂(lè)曲。
例五:找書(shū) 分析一:常訪問(wèn)的電子圖書(shū)館類(lèi)網(wǎng)站就那么幾個(gè),比如文藝類(lèi)的“www.shuku.net”。于是可以用SITE語(yǔ)法很簡(jiǎn)單的找到某本書(shū)(如果該網(wǎng)站上有的話)。比如,“舊唐書(shū) site:shuku.net”,就可以馬上找到該書(shū)。如果沒(méi)有,通常別的網(wǎng)站上也很難找到。因此,找書(shū)的關(guān)鍵,是你了解一大批著名的圖書(shū)館網(wǎng)站?!?br />分析二:我上面介紹的第一項(xiàng)關(guān)鍵字選擇技巧特定詞法,對(duì)于迅速找到某書(shū)或者文章也是極其有用的,當(dāng)然,這得建立在你已經(jīng)讀過(guò)該書(shū),對(duì)書(shū)的內(nèi)容有印象的基礎(chǔ)上。比如如果了解堂吉訶德一書(shū)戰(zhàn)風(fēng)車(chē)的大致內(nèi)容,就可以用“吉訶德 風(fēng)車(chē) 桑喬”迅速找到該書(shū)。
5 掌握搜索結(jié)果價(jià)值高低的簡(jiǎn)單評(píng)測(cè)方法
一次成功的搜索由兩個(gè)部分組成:正確的搜索關(guān)鍵詞,有用的搜索結(jié)果。在你點(diǎn)擊任何一條搜索結(jié)果之前,快速地分析一下你的搜索結(jié)果的標(biāo)題、網(wǎng)址、摘要,會(huì)有助于你選出更準(zhǔn)確的結(jié)果,幫你節(jié)省大量的時(shí)間。當(dāng)然,到底哪一個(gè)是你需要的內(nèi)容,取決于你在尋找什么,評(píng)估網(wǎng)絡(luò)內(nèi)容的質(zhì)量和權(quán)威性是搜索的重要步驟。
一次成功的搜索也經(jīng)常是由好幾次搜索組成的,如果對(duì)自己搜索的內(nèi)容不熟,即使是搜索專(zhuān)家,也不能保證第一次搜索就能找到想要的內(nèi)容。搜索專(zhuān)家會(huì)先用簡(jiǎn)單的關(guān)鍵字測(cè)試,他不會(huì)忙著仔細(xì)查看各條搜索結(jié)果,而是先從搜索結(jié)果頁(yè)面里尋找更多的信息,再設(shè)計(jì)一個(gè)更好的關(guān)鍵字重新搜索,這樣重復(fù)多次以后,就能設(shè)計(jì)出很棒的搜索關(guān)鍵詞,也就能搜索到滿意的搜索結(jié)果了[7]。
由于因特網(wǎng)信息資源還存在良莠不齊、信息垃圾充斥的現(xiàn)象,許多學(xué)者對(duì)因特網(wǎng)信息資源的準(zhǔn)確性、可靠性還存有一定的懷疑,基于這一方面的原因,對(duì)于搜索引擎檢索結(jié)果價(jià)值的高低進(jìn)行簡(jiǎn)單測(cè)評(píng)也是我們應(yīng)該掌握的檢索技能之一,對(duì)具體檢索結(jié)果價(jià)值高低及權(quán)威性的測(cè)評(píng)方法有如下幾點(diǎn):
5.1 根據(jù)檢索結(jié)果輸出的排序測(cè)評(píng)
搜索引擎的檢索結(jié)果集通常是很龐大的,大量的網(wǎng)頁(yè)使得檢索者無(wú)法逐一瀏覽,搜索引擎可以按網(wǎng)頁(yè)與檢索提問(wèn)的相關(guān)程序進(jìn)行排序,最相關(guān)的網(wǎng)頁(yè)通常排在最前面。目前依據(jù)網(wǎng)站被鏈接數(shù)量的多少,同時(shí)參考網(wǎng)站被點(diǎn)擊次數(shù)的多少來(lái)進(jìn)行排序的方法,是目前最通用的做法。
5.2 根據(jù)檢索結(jié)果發(fā)布者的權(quán)威性測(cè)評(píng)
所謂檢索結(jié)果發(fā)布者的權(quán)威性是指信息的發(fā)布者應(yīng)在相應(yīng)的專(zhuān)業(yè)領(lǐng)域具有一定的權(quán)威性。一般地說(shuō),某個(gè)專(zhuān)業(yè)較著名的權(quán)威機(jī)構(gòu)或?qū)<宜鶕碛械木W(wǎng)站和發(fā)布的信息是真實(shí)可靠的,具有較高的質(zhì)量。尤其是大學(xué)和研究機(jī)構(gòu)的網(wǎng)站,一般在發(fā)布前已對(duì)信息作過(guò)審查和篩選,這樣的信息權(quán)威性強(qiáng)。同時(shí)通過(guò)對(duì)網(wǎng)站被其他網(wǎng)站鏈接,被專(zhuān)業(yè)論文引用的情況也可以對(duì)該網(wǎng)站的權(quán)威性進(jìn)行分析[8]。因此,檢索結(jié)果發(fā)布者的權(quán)威性也是我們測(cè)評(píng)檢索結(jié)果的重要因素之一。
5.2.1 我們可以從頁(yè)面上部或底部尋找作者姓名、組織機(jī)構(gòu)名稱(chēng)或公司名稱(chēng)[9]
如果是個(gè)人頁(yè)面,那么是否有作者簡(jiǎn)介,看看他的受教育程度、職位、所屬單位等,如果是一個(gè)組織機(jī)構(gòu)或公司,是否有詳細(xì)的介紹頁(yè)面,其歷史怎樣?發(fā)布這些信息的目的如何?這些個(gè)人或單位你是否聽(tīng)過(guò)?是否是你熟悉的?信譽(yù)是否良好?這些都有助于你判讀出其頁(yè)面內(nèi)容的可信程度。
比如ChinaByte,從它的主頁(yè)上很容易找到“關(guān)于本站”選項(xiàng),里面有ChinaByte的歷史,下設(shè)頻道、相關(guān)編輯及聯(lián)系方式。如果你對(duì)哪個(gè)頻道有疑問(wèn),可以直接發(fā)電子郵件或打電話與各位編輯聯(lián)系。ChinaByte操作方式上的正規(guī)性從各個(gè)細(xì)小的方面都能體現(xiàn)出來(lái)。如此正規(guī)的網(wǎng)站,其內(nèi)容的可信度肯定會(huì)比較大。
5.2.2 可以從URL上可以得到一些該網(wǎng)站的線索
比如,凡帶“~”符號(hào)的大都是個(gè)人主頁(yè)。從域名的后綴上也可以得到一些大概的線索。
.edu是教育類(lèi)網(wǎng)站,既可能是嚴(yán)肅的學(xué)術(shù)研究,也可能學(xué)生隨意制作的主頁(yè)。
.gov或.gov.cn是政府網(wǎng)站,一般比較權(quán)威,可靠,不會(huì)隨意發(fā)布不準(zhǔn)確的信息。
.com或.com.cn是商業(yè)網(wǎng)站,最常見(jiàn),在介紹自己的產(chǎn)品時(shí)往往會(huì)夸大其辭,所以要注意“批判”性地接受。
.net網(wǎng)絡(luò)服務(wù)公司,為商業(yè)或個(gè)人用戶(hù)提供服務(wù)。
.org一般是非營(yíng)利性組織,其觀點(diǎn)可能帶有傾向性
可以點(diǎn)到該站點(diǎn)的主頁(yè)上,看一下該組織的相關(guān)資料
如果頁(yè)面上沒(méi)有其主頁(yè)的鏈接,可以直接訪問(wèn)域名前部的地址,那往往就是該網(wǎng)站的首頁(yè)。http://www..chinabyte.com/staticpages/builder/builder_schedule/asp.html這一大串網(wǎng)址,你只需要把地址中“/staticpages”以后的所有字母都刪去,只留http://www.chinabyte.com,然后敲回車(chē),往往就能看到該網(wǎng)址的首頁(yè)
6 Google搜索網(wǎng)站的設(shè)置方法
Q:如何全面的了解Google.com?
A:查看網(wǎng)站相關(guān)頁(yè)http://www.Google.com/about.html”。
Q:如何切換Google.com的初始語(yǔ)言界面?
A:點(diǎn)擊搜索欄右邊的“使用偏好”(Preferences),選擇“界面語(yǔ)言”(Interface Language)中你期望的語(yǔ)言,點(diǎn)擊最下面的“設(shè)定使用偏好”(Save Preferences)按鈕。需要提醒的是,Google用cookie記錄這個(gè)偏好,所以如果你把瀏覽器的cookie功能關(guān)掉,就無(wú)法進(jìn)行設(shè)定。
Q:如何設(shè)定每頁(yè)搜索結(jié)果顯示數(shù)量?
A:同上,進(jìn)入使用偏好,在該頁(yè)的“查看結(jié)果”(Number of Results)選擇顯示結(jié)果數(shù),數(shù)目越大,顯示結(jié)果需要的時(shí)間越長(zhǎng),默認(rèn)是10項(xiàng)。
Q:搜索到的鏈接無(wú)法打開(kāi)怎么辦?
A:鏈接無(wú)法打開(kāi)的原因很多,比如網(wǎng)站當(dāng)機(jī),或者ISP過(guò)濾等,可以點(diǎn)擊Google的“網(wǎng)頁(yè)快照”查看在Google服務(wù)器上的網(wǎng)頁(yè)緩存。
Q:打開(kāi)搜索結(jié)果的鏈接,可是該頁(yè)面太大,很難找到一下子找到目的資料怎么辦?
A:直接打開(kāi)“網(wǎng)頁(yè)快照”, Google會(huì)把關(guān)鍵詞用不同顏色標(biāo)記出來(lái),很容易找到。