計算機信息檢索系統:是利用計算機和壹定的通訊設備查找所需信息的壹種檢索方法。檢索系統是壹個結合了人類設計操作和計算機自動化處理的系統。
計算機信息檢索系統的保密性是通過信息項的訪問控制機制來實現的。對於基於文件系統的信息檢索系統,訪問控制壹般只能在文件級別,即通過打開文件時檢查密碼來控制未授權用戶檢索信息。
對於基於數據庫技術的檢索系統,訪問控制可以通過檢查密碼或調用用戶編寫的編碼和解碼子程序,防止未授權用戶調用文件、記錄甚至信息項中的壹個信息項級別的機密信息。
有六種檢索技術常用於擴展數據:
1.布爾邏輯檢索
使用布爾邏輯運算符對搜索詞或代碼進行邏輯組合是現代信息檢索系統中最常用的技術。常用的布爾邏輯運算符有三種,即邏輯OR、邏輯AND和邏輯NOT。
2.攔截檢索
截取檢索是計算機檢索系統中非常常見的技術。由於西方語言的構詞特點,名詞的單復數形式在檢索中往往不壹致;意思相同的單詞的英式和美式拼寫不壹致;在詞幹上加上不同性質的前綴和後綴,可以派生出很多意思相近的詞,等等。這是使用分詞檢索的需要。
3.位置檢索位置檢索又稱為全文檢索和鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進行檢索,詞與詞之間的邏輯關系結合位置運算符,限定檢索詞之間的相對位置。這是壹種不依賴詞庫,可以直接使用自由詞進行搜索的技術方法。
4.有限字段檢索
字段限制檢索是指將搜索詞限制在數據庫記錄中的壹個或幾個字段的檢索方法。在檢索系統中,數據庫中通常有兩類字段可供檢索:表達文獻主題內容特征的基本字段和表達文獻外部特征的輔助字段。
5.加權檢索
加權檢索是壹些檢索系統提供的定量檢索技術。
加權檢索和布爾檢索、截斷檢索壹樣,也是文獻檢索的壹種基本檢索方法,但與它們不同的是,加權檢索的重點不是確定檢索詞或串是否存在於數據庫中,與其他檢索詞或串是什麽關系,而是確定在滿足檢索邏輯後,檢索詞或串對文獻是否命中的影響程度。
6.聚類檢索
聚類就是在不知道應該歸入多少類的情況下,將未分類的事物歸入同壹類,根據事物內部屬性的不同,將屬性相近的信息歸入同壹類。
百度百科-計算機信息檢索系統