1、搜索引擎的歷史
現代意義上的搜索引擎鼻祖是1990年由蒙特利爾的麥吉爾大學學生AlanEmtage、PeterDeutsch、BillWheelan發明的Archie。當時WorldWideWeb還未出現,Archie是第一個自動搜索互聯網上FTP網站文件的程序。Archie是一個可搜索FTP文件名的列表,用戶必須輸入精確的文件名搜索,然后Archie會告訴用戶哪一個FTP地址可以下載該文件。Archie還不是真正意義上的搜索引擎。
隨著Internet的快速發展,出現了專門用于檢索信息的Robot程序,該程序能自動地不斷重復地在網絡上檢索信息,這種行為很像一只蜘蛛在Internet上爬來爬去,所以又稱為Spider程序。
1993年,互聯網上出現了最早的Web瀏覽器Mosaic,次年Netscape推出了Navigator。瀏覽器的發展促使Web得到迅速推廣,站點數目以驚人的速度增加。隨著互聯網的迅猛發展,信息按幾何式增長,搜索引擎開始快速發展起來。
1994年7月,世界上出現了最早的真正意義上的搜索引擎——Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。同年4月,美國斯坦福大學的兩位博士生DavidFilo和美籍華人楊致遠共同創建了Yahoo!,并成功地使搜索引擎的概念深入人心,從此搜索引擎進入了快速發展時期。
一般把這一時期的搜索引擎被稱為第一代搜索引擎。第一代搜索引擎初期還分為目錄式搜索和全文式搜索兩類。Yahoo!是第一代搜索引擎的代表,屬于典型的目錄式分類結構,而AltaVista則屬于全文式搜索引擎。第一代搜索引擎是以人工方式或半自動方式搜集、整理信息,往往以反饋結果的數量來衡量檢索結果的好壞。而研究表明,第一代搜索引擎檢索結果的相關性較差,資料更新緩慢。
隨著網絡信息的日益增長,以人工分類整理的搜索引擎已經不能滿足用戶搜索信息的要求。
自1998年開始,出現了一個搜索引擎空前繁榮的時期。隨著Google的出現,第二代搜索引擎誕生。它們不僅拓展了搜索引擎的生存空間,而且還極大的提高了搜索的質量和效率。除Google外,Yahoo!在2004年也推出了自己的第二代搜索引擎——“一搜”(Yiso)。在國內,百度逐漸取代新浪、搜狐,成為中文第二代搜索引擎的老大。第二代搜索引擎中最具代表性、最成功的還是Google。總的來說,第二代搜索引擎依靠機器抓取,建立在超鏈分析基礎之上,提高了查準率、查全率和檢索速度。
2003年8月20日,中國搜索CEO陳沛首次提出了第三代搜索引擎的概念。2004年12月,中國搜索推出的網絡豬3.0被陳沛看成是第三代搜索引擎個性化信息門戶的開始。
2006年4月18日,中國搜索發布了客戶端搜索軟件IG(InternetGateway),而IG是網絡豬的升級產品。另外,2004年8月,搜狐CEO張朝陽也提出了第三代互動搜索概念。
2005年9月,美國政府提出開始研制第三代搜索引擎。2005年10月,微軟公布了該公司做第三代搜索引擎的構想。2007年4月,中國Jwmguagua(精武門呱呱)率先提出了第三代直潛全能搜索引擎技術系統。經過5年多的探索和市場“歷練”之后,全球第三代搜索引擎呈現出兩個發展方向:一個是以Google為主的“技術驅動型”理念;一個是以Jwmguagua(精武門呱呱為主的“服務驅動型”理念。第三代搜索引擎是智能搜索引擎,呈現出多元化、智能化、個性化的發展趨向。
2、搜索引擎的發展趨勢
1)向智能化方向發展
智能化是網絡信息檢索未來的主要發展方向。隨著網絡用戶對檢索精確度和效率的不斷提高,越來越多的搜索引擎重視自身在檢索功能和檢索服務上的智能化程度,將涌現出智能搜索引擎。智能搜索引擎可以通過自然語言與用戶交互,最大限度地了解用戶的需求,它能為用戶提供了一個真正智能化的、個性化的信息過濾和推送服務。因此,智能搜索引擎成為今后搜索引擎的發展趨勢。
2)向個性化、特色化方向發展
個性化是指各網絡檢索工具注重內容的特色化和服務的個性化。個性化的核心是跟蹤與分析用戶的搜索行為,充分利用這些信息來提高用戶的檢索效率,并為用戶提供全程幫助和服務,使得個性化搜索更符合每個用戶的需求。
3)向多媒體化方向發展
未來的搜索引擎將在技術上更加成熟,在搜索內容上向多媒體化發展。視頻、音頻等多媒體信息的檢索數據量高速增長,多媒體搜索引擎的發展迫在眉睫。同時,搜索引擎在向用戶提供檢索結果時仍可以向多媒體方向發展,使得檢索結果形式多樣化、生動化,更好地滿足用戶的需求。向多媒體化方向發展是搜索引擎發展的又一個新趨勢。
4)向功能多樣化方向發展
首先表現在可以檢索的信息形態多樣化,如文本、聲音、圖像、動畫;其次表現在搜索引擎已不僅僅是單純的檢索工具,正在向其他服務范疇擴展,提供站點評論、天氣預報、新聞報道、股票點評、各種黃頁(如電話號碼、航班和列車時刻表、地圖等)、免費電子信箱,以多種形式滿足讀者的需要。
5)向商業化方向發展
隨著互聯網上信息服務和電子商務的發展,用戶基數的不斷增長,為電子信息的增值服務提供了廣闊的空間。在這里匯集了最新的思想、最先進的技術和最大的潛在市場。搜索引擎已經成為一項產業,它的商業利益成為推動系統完善和擴展的主要動力,網絡信息的檢索與利用由公用性轉向商業化。
6)向專業化方向發展
由于用戶千差萬別,對信息搜索往往有不同的要求。綜合性的搜索引擎收錄的范圍太廣、太大、無法滿足某一特定的需求。而垂直性專業搜索引擎則可解決這一難題。垂直性專業搜索引擎只面向某一特定的領域,專注于自己的特長和核心技術,能保證對該領域的信息的收錄齊全與更新迅速。
7)向可視化方向發展
可視化信息檢索是把文獻信息、用戶提問、各類檢索模型以及利用檢索模型進行信息檢索的過程,展示在一個可視化空間中,并向用戶提供信息檢索服務。可視化搜索避免繁瑣的操作過程,使用戶更直接、方便、快速、高效地獲取信息和知識。隨著網絡技術的不斷發展,以及XML、RDF、GRID在信息中的應用,可視化檢索將成為搜索引擎新的發展方向。