當前位置:法律諮詢服務網 - 企業資訊 - 信息搜索定義

信息搜索定義

1

信息檢索(information retrieval):是指將信息接壹定的方式組織和貯存起來,並根據信息用戶的需要找出有關信息的過程。所以,它的全稱又叫信息存貯與檢索(information storage and retrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的後半部分,即根據課題的需要,主要借助於檢索工具,從信息集合中找出所需信息的過程,相當於人們所說的信息查尋(information search)。信息檢索的過程往往需要壹個評價反饋途徑,多次比較匹配,以獲得最終的檢索結果。

2

當妳拿到壹本書就會在封底或版權頁看到由“ISBN”(國際標準書

號)和10位數字為標誌組成的字樣,其格式為:ISBN7-5004-1693-

8/I·200,它的含義是:ISBN組號-出版者號-書名號-校驗號/圖書

分類號·種次號。組號代表壹個地區或地理區域、國家或集團的編號,

中國的編號是“7”;出版者號代表出版社的編號;書名號是出版社出

版的壹種特定出版物的名稱;校驗號校驗ISBN編號是否合法。中國加入

ISBN系統之後制定了相應的國家標準-中國標準書號,並於1987年1月

實施。

如此繁復的代號和數字組合有什麽作用呢?其壹,幫妳了解圖書的

出版規模。ISBN由十位數字組成,其中校驗號恒定為壹位數,組號可取

1-5位數。如果壹個國家或地區的組號是五位數,其中出版者號與書名

號位數之和就是四位數,通過排列組合,這個國家或地區的出版量最多

只是壹萬種;而組號如果是壹位數,那麽其中出版號與書名號位數之和

就是八位數,其出版量將高達壹億種,組號的位數越大出版量越小,組

號的位數越小出版量越大。我國的組號是〃7〃,可見其出版量之大。

其二,幫妳了解出版者。首先,可以了解出版者的出版規模和目前

的圖書出版數量。ISBN的出版者號與書名號的位數之和恒等於八。目前

,我國出版者可取代碼2至5位數,如果出版者號是三位,書名號就是五

位數,則出版量就是十萬種,出版者號的位數越小,書名號的位數越大

,出版量也越多,反之出版量越少。例如:商務印書館1996年7月出版

的《現代漢語詞典》修訂第三版,中國標準書號為ISBN7-100-01777

-7/H.519。“100”是商務印書館的代碼,“01777”是書名號,表示

商務可出版10萬種圖書,至1996年7月已出版了1778種(出版者所出版

的第壹種圖書書名號從0計算)。另外,可以了解出版者是綜合性的還

是專業性的。ISBN的書名號與種次號分別代表的是可以出版多少種圖書

,已經出版了多少種和某壹類目出版了多少種。例如,人民文學出版社

的《當今十大奇案》,中國標準書號是ISBN7-02-000420-2/I·421

其書名號與種次號相等,說明人民文學出版社是專業性的出版社,它以

出版文學類的圖書為主。

其三,方便了圖書館工作人員。由於ISBN具有世界唯壹性,所以通

過ISBN檢索的準確性要高於通過書名檢索的準確性。書名有重名現象,

比如茅盾有長篇小說《虹》,而英國的勞倫斯也有長篇小說《虹》。通

過ISBN檢索具有唯壹性,檢索的速度也要高於通過書名檢索的速度。書

名少則幾個字,多則十幾個字,而ISBN只有十個阿拉伯數字,壹般的工

作人員都能夠錄入且速度要比錄入書名的速度快得多。

總之,中國標準書號的最大特點是將國際標準書號(ISBN)和全國

統壹書號中的分類號和種次號的成份結合起來,結構簡單層次性強,便

於計算機處理和檢索,給出版、發行、訂購、統計、分編等提供很大的

方便,是讀者進入圖書館查閱圖書的壹個重要檢索點。

3

計 算 機 檢 索 系 統 的 構 成

計算機檢索系統由計算機硬件、軟件、數據庫和通訊網絡構成。

壹、計算機硬件

計算機硬件是系統采用的各種硬設備的總稱,主要包括具有壹定性能的主計算機、外圍設備以及與數據處理或數據傳送有關的其他設備。

二、軟件

軟件由系統維護軟件與檢索軟件構成。系統維護軟件,如數據庫管理程序、詞表管理程序等,其作用是保障檢索系統的高效運轉。檢索軟件是用戶與系統的界面,用戶通過檢索軟件進行檢索,檢索軟件功能的強弱直接影響著檢索效果。檢索軟件可以分為指令式、菜單式和智能接口等。

三、數據庫

根據ISO/DIS 5127標準,數據定義為:“至少由壹種文檔組成,並能滿足某壹特定目的或某壹特定數據處理系統需要的壹種數據集合。”通俗地說,數據庫就是在計算機存儲設備上按壹定方式存儲的相互關聯的數據集合。

按國際上通用的分類方法,數據庫可以劃分為以下類型:

1. 參考數據庫

參考數據庫(Reference databases)是指引用戶到另壹信息源以獲得原文或其他細節的壹類數據庫。它包括書目數據庫(Bibliographic databases)和指南數據庫(Referral database或Directory database)兩種。

書目數據庫是指存儲某個領域的二次文獻(如文摘、題錄、目錄等書目數據)的壹類數據庫,有時又稱為二次文獻數據庫,或簡稱為文獻數據庫。如中國機械工程文摘數據庫,屬於此類型數據庫。

指南數據庫也稱指示性數據庫,是指存儲關於某些機構、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其他有關信息源獲取更詳細的信息的壹類數據庫。如產品目錄、機構名錄、研發項目、基金項目等數據庫均屬於此類型。

2. 源數據庫

源數據庫(Source databases)是指能直接提供原始資料或具體數據的數據庫,用戶不必再查閱其他信息源。它可以分為:

(1)數值數據庫這是壹種專門提供以數值方式表示的數據的源數據庫,如統計數據庫、財務數據庫等。

(2)文本-數值數據庫這是壹種能同時提供文本信息和數值數據的源數據庫,如企業信息數據庫、產品數據庫等。

(3)全文數據庫這是壹種存儲文獻全文或其中主要部分的源數據庫,如法律法規全文庫、期刊全文庫等。

(4)術語數據庫這是壹種專門存儲名詞術語信息、詞語信息以及術語工作和語言規範工作成果的源數據庫,如名詞術語信息庫、各種電子化辭書等。

(5)圖像數據庫這是壹種用來存儲各種圖像或圖形信息及有關文字說明資料的源數據庫,主要應用於建築、設計、廣告、產品、圖片或照片等資料類型的計算機存儲與檢索。

除上述幾種類型的數據庫外,還有能同時存儲多種不同類型數據的數據庫,即混合型數據庫。另外,按其載體不同又可分成磁媒體數據庫、光盤數據庫和多媒體數據庫等。

四、通訊網絡

由於現代通信技術的發展,公***數據傳輸技術為信息的傳遞提供了保障,信息檢索逐漸發展成為網絡檢索,通過數據傳輸網將各個計算機連接起來。每個計算機成為網絡中的壹個節點,每個節點可含壹個或多個數據庫,網絡上的每個節點和其終端只要有授權均可對網絡中的數據庫進行訪問,實現資源***享。隨著空間技術的發展,信息檢索已進入了信息傳遞-衛星通訊-計算機技術三位壹體的新階段。

4

《中國圖書館分類法》有22大類:A 馬克思主義、列寧主義、毛澤東思想、鄧小平理論,B 哲學、宗教,C 社會科學總論,D 政治、法律,E 軍事,F 經濟,G 文化、科學、教育、體育,H 語言、文字,I 文學,J 藝術,K 歷史、地理,N 自然科學總論,O 數理科學和化學,P 天文學、地球科學,Q 生物科學,R 醫藥、衛生,S 農業科學,T 工業技術,U 交通運輸,V 航空、航天,X 環境科學、安全科學,Z 綜合性圖書。

詳細類目可查閱圖書館主頁《中國圖書館分類法》。

體育有:G 文化、科學、教育、體育

5

1.是否支持全文檢索

2.檢索結果如何排序,相關性,時間等,是否全面

3.檢索功能是否全面,如布爾邏輯檢索、關鍵詞檢索、位置檢索、截詞檢索、限制檢索等等

4.查詢速度如何,維護更新如何

5.界面是否簡單易用,易用性是否強

建議妳找本關於《信息檢索》的書來看看,我說的特別簡單,手頭沒有書,妳要是想具體看看,還得看書。人大出版社的那本信息檢索不錯。

6

根據文獻的有關信息查找相應的館藏目錄或聯合目錄,找到收藏單位,再索取或復制原文。如果本單位圖書館沒有收藏所需文獻,用戶可以通過館際互借或文獻傳遞服務獲取。

7

學術性圖書館當然以國家圖書館最權威,各高校圖書館都收藏有相應的學術資源,可通過中國高校文獻保障系統(Calis)來查重要高校的館藏和信息服務情況。

  • 上一篇:信息采集審核會不通過嗎?
  • 下一篇:興平概況
  • copyright 2024法律諮詢服務網