信息資源建設與信息網絡建設相比,是壹項更為長期、更為艱苦的工作。隨著“數字油田”建設的進展,作者認為在油田信息資源建設過程中,還應該重點註意以下問題:
壹、對資源建設的認識問題
雖然對“數字企業”理解不同,但有壹點是大家所***識的,即企業管理的功能延伸並不是數字企業,擁有海量的有組織的數字化信息資源才是數字企業的“物質”基礎和核心,才是數字化企業的根本內涵,如沒有壹定規模的信息資源,數字企業也就無從談起。因此,信息資源建設是數字企業建設的核心內容,我們在認識上必須把信息資源建設作為在數字企業建設中重中之重,絕不能重硬輕軟或重硬重軟,忽視信息資源的建設。
數字企業信息資源建設的內容壹般包括生產經營管理數字化、檔案圖情文獻數字化和網絡資源本地化,而數據庫的開發是信息資源建設的核心。在當前經費缺乏的情況下,大規模的進行數字化是不宜提倡的;引進電子資源應適可而止,更何況數字企業是買不來的,數字企業是實用系統,是建設過程,永不終止,買來的資源終歸是別人的資源。當前企業還是應該憑借其自有人才在信息的篩選、分類、組織、標引、優化等方面的優勢,加強二次信息資源庫的建設,同時利用互聯網提供的巨大信息資源建立各種專題庫、導航庫,以點代面,逐步推進信息資源的建設工作。
同時應該註意的是,信息資源建設工作不僅僅是簡單地進行數字化轉換、購買電子文獻或者下載網上資源就行了,它實際上是壹項超大規模的信息資源在數字狀態下重組和再創造的創新工程,企業必須對來自各方面的信息資源進行系統的整理、分類、合並和集成,通過二次的歸並、組織、鏈接、知識挖掘等工作,創建油田信息資源虛擬***享平臺,使相關的多元化信息和不同系統有機融合並實現信息資源的統壹檢索、管理和認證,加強信息資源的組織、管理,達到知識管理的高度,並為提高信息資源的利用率而服務。
二、資源建設的標準問題
數字企業信息資源建設的過程,實際上就是將資源電子化、數字化後建成各種類型數據庫,最後形成知識倉庫的過程。在建庫過程中,必須嚴格遵循和充分利用各種正式標準,盡量避免不依規範和標準而盲目建立“簡易格式”庫和非標準數據庫,導致大量信息資源不能相互交換和集中的現象。即使少數不是嚴格按標準格式進行組織的資源庫,也必須考慮對數據項的充分描述,在建庫時留有余地,並對以後的數據轉換與銜接留有靈活的接口。
但同時我們也不能過分強調標準化,而忽視信息儲存和檢索的效率。目前有關數字信息資源建設的相關新標準比較多,如元數據標準、檢索語言標準、數據描述語言標準、電子圖書標準等,但真正成熟並全面推廣應用的標準比較少。鑒於這種情況,在信息資源建設時,應盡量應用成熟的已有標準,同時考慮適合發展需要的標準,在實現信息資源交換的基礎上將工作重心放到信息資源的快速檢索、快捷傳遞和方便利用上。
綜合國內外數字企業信息資源建設的經驗,建議在的數據記錄結構與記錄格式上,仍采用基於ISO2709的文獻格式標準(具體為Dublin Core(DC)、CNMARC、CCFC),這樣既能和國際接軌,也能充分地利用企業自動化過程中形成的數據;而對圖像或者全文數據,目前國內已有PDG、PDF、NLC、CAJ等格式,我們建議不宜采用PDG、NLC、CAJ等單壹廠商推行的格式,而應采用國際通行的PDF格式標準或者ML、XML格式。
三、資源建設的側重點問題
信息資源建設是壹個知識密集、勞動力密集的工作,需要投入大量的人力和物力,在經費有限的情況下,企業不可能有龐大的人力、物力去建設“大而全”、“小而全”的信息資源,也沒有這個必要。因此,各企業在信息資源建設過程中,必須采取有所為有所不為的方針,有所分工,有所側重,應立足本企業特色和學科優勢,以特色數據庫建設為核心,將本企業最具特色的信息資源和用戶最需要的信息資源,作為企業數字信息資源建設優先選擇的對象。
實踐證明,企業的信息資源不能完全依賴外部,必須走自己的路,實現本企業特色;只有特色數據庫才受歡迎,只有提供特色數據庫的信息系統才有生命力。因為特色數據庫資源壹般都以特定的地域、特定的行業、特定的主題為基本內容,具有獨創性和排它性,可充分滿足用戶的個性化、專業化的需求;而各企業通過特色數據庫的建設,不僅可突出企業特色和科研方向,為教學科研提供高層次、高效率的信息服務,而且可憑借自己擁有的特色數據庫資源,在激烈的資源建設競爭中取得壹席之地,拓展自己的生存空間。
特色數據庫的具體形式有二次文獻庫、二次文獻加全文庫、全文庫、網絡資源導航庫和多媒體庫。目前的數據庫絕大部分是文摘型的二次文獻庫,但建設二次文獻庫由於投入的人力、物力比較大,現在很多部門都在弱化此項工作。利用全文數據庫技術,通過仔細的分類標引,建立全文庫可能是今後發展的壹個方向。例如解放軍軍械工程學院建立的裝備文獻數據庫,通過企業人員專業的分類標引,利用非結構化數據庫技術快捷方便地建立起全文庫和多媒體庫,就具有很強的特色。
針對油田的實際情況,可以重點先行開發勝利油田文獻查詢全文庫、科技檔案全文庫、科技論文全文庫、會議文獻庫等。
四、資源建設的重復性問題
目前各單位的信息資源建設由於缺乏統壹規劃、組織和協調,大多處於各自獨立、相對分散的狀態,因此不可避免地出現了不同程度的重復建設問題。由於種種原因,勝利油田以往各單位都是分散訂購資源,致使信息資源建設存在嚴重重復和浪費現象(例如:勝利油田圖書館、師專圖書館和石油學校圖書館就有60%的資源是重復的;中國學術期刊(光盤版)就有勝利油田圖書館、中心醫院圖書館、師專圖書館、設計院情報室、地質院、衛生防疫站六家重復購買,實際上,只需購買壹套建立鏡像站點,就可滿足全油田讀者在網上對5000多種中文期刊進行查詢、閱讀全文的需要,而現在四套卻只能滿足小部分讀者的需求,造成信息資源的嚴重浪費)。
要避免企業信息資源建設出現重復建設問題,領導機關應在統壹信息資源加工平臺和標準的基礎上,統壹規劃和協調,各單位從自己的特色信息資源做起,用統壹的標準建設各具特色、有所分工的數字資源庫;同時在統壹經費管理調撥下,各單位利用聯機聯合編目建庫系統,通過網絡實現聯合聯機采購、聯合建庫,分工協作,實現信息資源的***建***享。
五、資源建設的質量控制問題
信息資源的生命力主要在於能夠提供服務的信息資源的數量和質量,而質量更是關鍵,因為它直接影響到信息資源***享的可實現性和有效性。光擴充數量、僅僅以占有信息資源為目的、沒有合理的分類體系、不進行嚴格的分類控制和缺乏質量控制的信息資源建設,即使其信息資源再豐富也無異於壹座堆放垃圾的倉庫,分散無序的海量信息只會給利用者帶來困擾和煩惱。
另壹方面,信息資源具有長期存儲性,從十幾年前到目前連續生產的數據庫正是目前建設數字企業的重要基礎;而根據經驗,數據庫即使有著錄錯誤、標引錯誤等質量問題,修改數據庫也是非常困難,因為發現錯誤的人往往是檢索用戶,他不能及時通報數據庫維護人員;況且數據庫容量壹般都有幾十兆甚至幾百兆,備份數據、重新發布數據涉及到多個部門,往往導致將錯就錯,給資源的使用者造成很大的不便。因此,企業在進行信息資源建設時,必須註意信息資源建設的質量控制,尤其是在二次信息數據庫建設時,更應該加強數據著錄準確性和格式的標準性、數據標引、檢索語言的規範性,從而為提高信息資源的查全率、查準率提供可靠保障。
六、資源建設的技術問題
隨著信息技術的飛速發展,目前針對信息資源建設的數字化加工技術、數據庫技術、存儲與檢索技術已經基本成熟,很多廠商推出了相應的產品,應該說信息資源建設中的技術問題已經是壹個不是問題的問題。在這裏指出,主要是提醒各單位在進行信息資源建設時,在技術層面應“立足應用,以我為主”,提倡“拿來主義”,盡量引進成熟技術和產品或者與廠商合作建設,而不必單獨自行開發,浪費大量的時間和人力、財力,因為企業的優勢不在技術,而在對信息資源的組織、管理和利用,技術只是我們利用的工具而已。
同時,隨著技術的發展,很多成型的產品已經出現,尤其是軟件系統,很多技術都是通用的,需求也是***性的,只要在壹個單位成功,就可以向其它單位進行推廣。因此,在實際工作中,各企業應加強交流,註重成功應用案例的推廣,技術並不是阻礙信息資源建設的主要原因。在信息資源建設工作中,筆者認為起主導作用的應該是對信息資源的收集、加工、組織和處理等業務工作熟悉和擅長的信息管理人員,信息資源建設必須是以業務為主,而不是以技術為主。
當然,各企業在數字信息資源的建設過程中,還應註意轉變觀念、人才培養等問題,因為信息資源建設歸根結底需要企業人員來完成,只有提高信息管理人員的素質,培養出精通多種技能的知識型人才,才能真正做好信息資源建設。
企業要發展有賴於信息工作的加強和信息資源的建設,要實施油田信息資源***享和科技強業的重要戰略措施,必須作為壹項重要任務進行統壹規劃、分步實施,實現油田信息資源的***建、***知、***享,促進企業的發展,更好地發揮信息在文獻信息保障體系中的巨大作用,使企業能根據信息去適應市場,隨機應變,在千變萬化的市場競爭中立於不敗之地。(作者單位系勝利油田文化事業中心)