信息檢索的基本原理是:通過對大量的、分散無序的文獻信息進行搜集、加工、組織、存儲,建立各種各樣的檢索系統,並通過壹定的方法和手段使存儲與檢索這兩個過程所采用的特征標識達到壹致,以便有效地獲得和利用信息源。其中存儲是為了檢索,而檢索又必須先進行存儲。 詳細內容 相關文獻
chinalibs/zhaiyao.asp?titleid=46093
問題二:簡述信息檢索的基本原理 信息檢索(信息檢索),是指按照壹定的方式組織信息,並確定根據用戶的工藝和技術的信息需求的相關信息。信息檢索是信息檢索過程的後半部分窄,即找到處理從收集的信息所需的信息,也就是我們常說的信息檢索(信息檢索信息或尋求)。
問題三:文獻信息檢索的原理是什麽 信息檢索是指將信息按壹定方式組織和儲存起來,並針對信息用戶的特定需求查找出所需信息內容的過程。
計算機信息檢索是指利用壹定的檢索算法, 借助於特定的檢索工具, 並針對用戶的檢索需求, 從非結構處的數據中獲取有用信息的過程
信息檢索原理示意圖:如圖
信息檢索的實質是信息用戶的需求和壹定的信息 *** 的比較和選擇的過程,即匹配的過程。
信息檢索步驟
分析檢索課題,明確檢索要求
選擇檢索工具,選擇檢索途徑
確定檢索標識,確定檢索運算
構築檢索提問,實施檢索操作
獲取初步信息,調整檢索策略
獲得滿意結果
問題四:文獻檢索的基本原理 文獻檢索的全過程由文獻存儲與文獻檢索構成。文獻存貯是文獻管理者把壹定數量提示文獻特征的信息或從文獻中橋出的知識信息加以組織,編制成為檢索工具或組織成檢索系統,即編制檢索工具和建立檢索系統的過程。存貯是進行檢索的前提,也是檢索的基礎。文獻檢索是檢索者根據需要,從某―檢索工具或檢索系統中把相關的文獻線索或知識信息查找出來。即利用檢索工具和檢索系統檢索所需文獻的過程。
問題五:文獻信息檢索的原理是什麽 文獻檢索的基本原理信息檢索的基本原理是:通過對大量的、分散無序的文獻信息進行搜集、加工、組織、存儲,建立各種各樣的檢索系統,並通過壹定的方法和手段使存儲與檢索這兩個過程所采用的特征標識達到壹致,以便有效地獲得和利用信息源。其中存儲是為了檢索,而檢索又必須先進行存儲.
問題六:簡述計算機檢索的基本原理? 從硬盤中讀取妳電腦啟動需要的基本參數主要起自檢的作用現在很多筆記本電腦取消了自檢
希望采納
問題七:全文搜索引擎壹般采用什麽原理來采集信息 搜索引擎工作原理:發現網頁-蜘蛛捉爬取-建立數據庫-展現等循環工作
問題八:搜索引擎的工作原理是什麽? 搜索引擎的工作原理包括如下三個過程:首先在互聯中發現、搜集網頁信息;同時對信息進行提取和組織建立索引庫;再由檢索器根鄲用戶輸入的查詢關鍵字,在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並將查詢結果返回給用戶。
1、抓取網頁。每個獨立的搜索引擎都有自己的網頁抓取程序(spider)。Spider順著網頁中的超鏈接,連續地抓取網頁。被抓取的網頁被稱之為網頁快照。由於互聯網中超鏈接的應用很普遍,理論上,從壹定範圍的網頁出發,就能搜集到絕大多數的網頁。
發現、抓取網頁信息需要有高性能的“網絡蜘蛛”程序(Spider)去自動地在互聯網中搜索信息。壹個典型的網絡蜘蛛工作的方式,是查看壹個頁面,並從中找到相關信息,然後它再從該頁面的所有鏈接中出發,繼續尋找相關的信息,以此類推,直至窮盡。網絡蜘蛛要求能夠快速、全面。網絡蜘蛛為實現其快速地瀏覽整個互聯網,通常在技術上采用搶先式多線程技術實現在網上聚集信息。通過搶先式多線程的使用,妳能索引壹個基於URL鏈接的Web頁面,啟動壹個新的線程跟隨每個新的URL鏈接,索引壹個新的URL起點。當然在服務器上所開的線程也不能無限膨脹,需要在服務器的正常運轉和快速收集網頁之間找壹個平衡點。在算法上各個搜索引擎技術公司可能不盡相同,但目的都是快速瀏覽Web頁和後續過程相配合。目前國內的搜索引擎技術公司中,比如百度公司的網絡蜘蛛采用了可定制、高擴展性的調度算法使得搜索器能在極短的時間內收集到最大數量的互聯網信息,並把所獲得的信息保存下來以備建立索引庫和用戶檢索。
2、處理網頁。搜索引擎抓到網頁後,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引庫和索引。其他還包括去除重復網頁、分詞(中文)、判斷網頁類型、分析超鏈接、計算網頁的重要度/豐富度等。
索引庫的建立關系到用戶能否最迅速地找到最準確、最廣泛的信息,同時索引庫的建立也必須迅速,對網絡蜘蛛抓來的網頁信息極快地建立索引,保證信息的及時性。對網頁采用基於網頁內容分析和基於超鏈分析相結合的方法進行相關度評價,能夠客觀地對網頁進行排序,從而極大限度地保證搜索出的結果與用戶的查詢串相壹致。新浪搜索引擎對網站數據建立索引的過程中采取了按照關鍵詞在網站標題、網站描述、網站URL等不同位置的出現或網站的質量等級等建立索引庫,從而保證搜索出的結果與用戶的查詢串相壹致。新浪搜索引擎在索引庫建立的過程中,對所有數據采用多進程並行的方式,對新的信息采取增量式的方法建立索引庫,從而保證能夠迅速建立索引,使數據能夠得到及時的更新。
3、提供檢索服務。用戶輸入關鍵詞進行檢索,搜索引擎從索引數據庫中找到匹配該關鍵詞的網頁;為了用戶便於判斷,除了網頁標題和URL外,還會提供壹段來自網頁的摘要以及其他信息。
用戶檢索的過程是對前兩個過程的檢驗,檢驗該搜索引擎能否給出最準確、最廣泛的信息,檢驗該搜索引擎能否迅速地給出用戶最想得到的信息。對於網站數據的檢索,新浪搜索引擎采用多進程的方式在索引庫中檢索,大大減少了用戶的等待時間,並且在用戶查詢高峰時服務器的負擔不會過高(平均的檢索時間在0.3秒左右)。對於網頁信息的檢索,作為國內眾多門戶網站的網頁檢索技術提供商的百度公司其搜索引擎運用了先進的多線程技術,采用高效的搜索算法和穩定的UNIX平臺,因此可大大縮短對用戶搜索請求的響應時間。作為慧聰I系列應用軟件產品之壹的I-Search2000采用的超大規模動態緩存技術,使壹級響應的覆蓋率達到75%以上,獨有的自學習能力可自動將二級響......>>