2010年12月24日 星期五

資訊檢索


資訊檢索(Information Retrieval

  現今網路發達,很多人是寧可少逛馬路,也不能沒有網路。在這已是資訊爆炸的時代,”資訊焦慮”這一名詞大家應該都不陌生,而且很多人應該也是上網成癮症,報告組有作了三大搜尋引擎的PK比較表,其實現在很多學校的學生都喜歡用Google來查找資料,不外就是簡易及方便,這當然也比較符合人性,科技始終來自於人心囉!

   現在社會都講求快速,若各家資料庫都能整合的像Google般容易,學生又怎會不愛用呢!還好現在生意人腦筋動的快,也推出了整合查詢系統,只是圖書館又要多花一筆經費預算即是。但即便如此,很多學生依然不知學校圖書館有整合查詢系統,仍喜愛用Google找資料寫作業。所以,圖書館的利用教育是應該要加強,也許應先從各系所的老師們開始,老師們有概念後,上課也比較會分享給學生,如此推廣也許會更具成效。


        陳光華教授及吳括安在這篇「跨語言資訊檢索中查詢問題特性於檢索效益之影響」中提到:
  • 如何快速有效地檢索資訊 ,以最省力的方法得到檢索結果 ,是資訊檢索研究領域重視的問題與挑戰。

  • 為了評估資訊檢索技術的有效性 、優越性 ,及跨語性 ,以公正 、公開的方法進行評估 ,並得到研究領域的認同 ,則是資訊檢索評估研究的重要課題。

  • 一般而言 ,使用者進行資訊檢索的模式 ,是依據其資訊需求(Information
        need)轉化為查詢問題(Question),然後將查詢問題建構為查詢問句
      (Query),以輸入資訊檢索系統 ,接著資訊檢索系統在文件集合進行檢
        索 ,將可能符合需求的文件輸出給使用者。

  • 資訊檢索的評估便是希望模擬這樣的程序 ,因此測試集應包括文件集(Document set)與問題集(Question set)。當然 ,若涉及語言的因素 ,文件集與問題集則會分別包含不同語言的文件與問題。此外 ,為了判斷檢索所得文件的相關性,還會有答案集(Answer set),也就是文件與問題二者之間的相關判斷。換句話說 ,我們可將測試集視為資訊檢索系統評估的基礎資料,參與評估的資訊檢索系統必須依據所訂定的查詢問題 ,以文件集作為檢索對象 ,並將測試集提供的答案(相關判斷)視為標準答案 ,以進行檢索效益的評估。對於實際用於廣泛檢索評估之測試集,並為研究者接受 ,作為學術性資訊檢索實驗之評估依據 ,研究者會稱之為標竿測試集(Benchmark),有關資訊檢索評估的詳細程序與資訊檢索測試集的建構,請參見陳光華 、江玉婷(2000)一文。


維基百科定義如下:

      資訊檢索英語Information Retrieval)是指搜尋資訊的科學,如在檔案中搜尋資訊、搜尋件本身、搜尋描述檔案的metadata或是在資料庫中進行搜尋,無論是在相關的獨立資料庫或是超文字網路資料庫(如全球資訊網)。資訊檢索也是指依照使用者的資訊需求提供查詢的方法以及查詢的過程。


        資訊檢索像是剛開始存在的、跨學科的,其建立於電腦科學數學圖書館學資訊科學認知心理學語言學統計學理學等。自動化的資訊檢索系統被用來減少資訊超載Information overload),很多大學公共圖書館使用資訊檢索系統提供檢索書目期刊和其他的檔案,資訊檢索系統通常與物件和檢索需求有關,檢索需求會被使用者用正式的陳述來描述其資訊需求放置於資訊檢索系統當中,而物件是一個實體被儲存於資料庫當中,一個檔案就是一個資料物件,通常檔案本身不會被直接儲存於資料庫中,但是會在系統中使用檔案代理者來代替檔案本身。

【參考來源】

維基百科
小組簡報

Brin, S. & Page, L. (1998). The anatomy of a large-scale hypertextual Web search
engine. Computer Networks,30(1-7), 107-117.


陳光華、吳恬安(2008)。「跨語言資訊檢索中查詢問題特性於檢索效益之
響」。教育資料與圖書館學, 462期,頁183-210

沒有留言:

張貼留言