當前位置:法律諮詢服務網 - 法律諮詢 - 檔案的數字化過程是怎樣的?

檔案的數字化過程是怎樣的?

壹.術語和定義

1,數字化

通過計算機技術將模擬信號轉換成數字信號的過程。

2.紙質文件的數字化

利用掃描儀或數碼相機等數字設備對紙質文件進行數字化處理,並轉換成存儲在磁帶、磁盤、光盤等載體上的計算機可識別的數字圖像或數字文本的過程。

3.數字圖像

表示物理圖像的整數數組。由相同維度的連續圖像生成的二維或更高維的采樣和量化函數。對矩陣(或其他)網絡上的連續函數進行采樣,並最小化采樣點處的值。

4.黑白二值圖像

只有黑白灰度的數字圖像。對應的是黑白的文字草稿,線條畫等等。

5、連續色調靜止圖像

由兩個以上灰度級或不同顏色通道的不同陰影組成的靜態數字圖像。在紙質文件的數字化過程中,通常有兩種模式:灰度掃描和彩色掃描。

6.解決

每單位長度的圖像中包含的點數或像素數通常用每英寸點數(dpi)來表示。

7.變形

數字轉換後,數字圖像與原始文件在顏色和幾何形狀上的偏差程度。

8、可懂度

數字圖像向人或機器提供信息的能力。

9.圖像壓縮

去除圖像冗余或圖像近似的任何過程,其目的是以更緊湊的形式表示圖像。

二、數字化紙質檔案的基本要求

1,基本原則

紙質檔案數字化的基本原則是使檔案信息資源能夠準確、方便、快捷地被利用,使可以公開的檔案信息資源能夠被享用,以滿足社會對檔案利用的需求。

2.確定數字對象的原則。

要數字化的對象要按照壹定的原則和方法進行確認,只有符合壹定要求的紙質檔案才能進行數字化。

1)符合國家法律法規的原則。

紙質檔案的數字化必須符合國家關於檔案開放的規定及相關規定。

2)價值原則

屬於歸檔範圍,應永久或長期保存,具有較高社會利用價值的檔案,可納入數字化處理範圍。

3.基本鏈接

紙質檔案數字化的基本環節主要包括:檔案整理、編目建立、檔案掃描、圖像處理、圖像存儲、數據質量檢查、數據掛鉤、數據驗收、數據備份、成果管理等。

4.進程管理

1)要加強紙質檔案數字化各個環節的安全保密管理機制,確保原始檔案和數字化檔案信息的安全。

2)紙質檔案數字化的各個環節都要詳細登記,及時整理匯總,裝訂成冊,在完成數字化工作的同時建立完整規範的記錄。

第三,文件整理

掃描前,應根據檔案管理情況,按以下步驟對檔案進行妥善整理,並根據需要進行標記,以保證檔案的數字化質量。

1目錄數據準備

2拆除捆綁

3區分掃描和非掃描零件

4頁裁切

5備案和登記

6裝訂

第四,文件掃描

1,掃描模式

1)根據文件格式的大小(A4、A3、A0等。),選擇相應規格的掃描儀或專業掃描儀(如工程圖紙可使用0號圖紙掃描儀)進行掃描。大幅面文件可以用大幅面數字平臺掃描,或者縮微後用膠片數字轉換設備掃描,也可以用小幅面掃描後的圖像拼接處理。

2)紙張狀況不佳,太薄、太軟或太厚的文件要用平板掃描;紙質條件好的文件可以高速掃描,提高工作效率。

2.掃描顏色模式

1)掃描顏色模式壹般包括黑白二進制、灰度、彩色等。通常使用黑白二進制值。

2)黑白頁面、字跡清晰無插圖的文件,可以黑白二進制模式掃描。

3)黑白頁面,但字跡清晰度或插圖較差的文件,多色頁面的文件可以用灰色模式掃描。

4)頁面上有紅頭文件、印章或黑白照片、彩色照片、彩色插圖的文件,可根據需要進行彩色模式掃描。

3.掃描分辨率

1)掃描分辨率參數的選擇以掃描圖像清晰完整,不影響圖像的利用效果為前提。

2)黑白二進制、灰度、彩色模式掃描文件時,分辨率壹般建議≥100dpi。特殊情況下,如文字小、文字密、清晰度差等。,分辨率可以適當提高。

3)對於需要OCR漢字識別的文件,掃描分辨率建議選擇≥200dpi。

4.掃描註冊

認真填寫紙質文件數字化轉換過程交接登記表,登記掃描頁數,核對各文件實際掃描頁數與文件整理量中填寫的文件頁數是否壹致。如不壹致,應註明具體原因和處理方法。

動詞 (verb的縮寫)圖像處理

1,影像數據質量檢查

1)檢查圖像的偏斜度、清晰度和失真程度。如果發現不符合圖像質量的要求,就要對圖像進行重新處理。

2)如果掃描的圖像文件不完整或因操作不當無法清晰識別,應重新掃描。

3)如有漏掃描文件,及時補掃描,正確插入圖像。

4)如發現掃描圖像的排列順序與原文件不壹致,應及時調整。

5)認真填寫相關表格,記錄質量檢查結果和處理意見。

2.改正,矯正;[化工] 精餾;[電] 整流;[數] 求長

應該對偏轉圖像進行校正,以實現偏轉的基本視覺感知。方向不正確的圖片要旋轉還原,符合閱讀習慣。

3.凈化

黑點、黑線、黑框、黑邊等雜質。圖像頁面中影響圖像質量的雜質應去除。在處理過程中,應遵循在不影響可理解性的前提下展現文件原貌的原則。

4.圖像拼接

掃描不同區域的大幅面文件形成的多幅圖像應拼接合並成壹幅完整的圖像,以保證文件數字圖像的完整性。

5、切邊處理

彩色模式下掃描的圖像應進行修剪,去除多余的白邊,以有效減少圖像文件的容量,節省存儲空間。

第六,圖像存儲

1,存儲格式

以黑白二進制模式掃描的1)圖像文件通常以TIFF(G4)格式存儲。以灰色模式和彩色模式掃描的文件通常以JPEG格式存儲。存儲時壓縮比的選擇應以保證掃描圖像的易讀性和最小化存儲容量為前提。

2)提供網絡查詢的掃描圖像,也可以保存為CEB、PDF或其他格式。

2.圖像文件的命名

1)紙質文件目錄數據庫中的每壹份文件都有壹個唯壹的文件號與之對應,該文件的掃描圖像文件就是以這個文件號命名的。

2)多頁文件可以用這個文件號建立相應的文件夾,圖像文件可以按頁碼順序命名。

七、目錄數據庫。

1,數據格式選擇

編目數據庫建設應選擇通用數據格式。選擇的數據格式應該能夠通過XML文檔直接或間接交換數據。

2、文件描述

根據《檔案著錄規則》(DA/T18)的要求,建立了檔案目錄數據庫。

3、目錄數據質量檢查

通過人工校對或軟件自動校對檢查目錄數據庫的質量。檢查描述項目是否完整,描述內容是否規範準確。如果發現不合格的數據,應修改或重新記錄。

八、數據掛鉤

1,匯總掛鉤

檔案數字化轉換過程中形成的目錄數據庫和影像數據庫,通過質量檢查確認“合格”,然後通過網絡及時加載到數據服務器進行匯總。通過編程或借助相應的軟件,可以實現目錄數據自動查找相關數字圖像,添加相應的電子地址信息,實現批量、快速掛鉤。

2.數據關聯

基於紙質文件目錄數據庫,從每個紙質文件掃描的壹個或多個圖像被存儲為圖像文件。在相應文件夾中存儲圖像文件時,需要仔細檢查每個圖像文件的名稱是否與歸檔目錄數據庫中的文件號相同,圖像文件的頁數是否與歸檔目錄數據庫中的文件頁數相同,圖像文件的總數是否與歸檔目錄數據庫中的文件數相同。通過每個圖像文件的文件名與該文件在歸檔目錄數據庫中的文件號的壹致性和唯壹性,建立壹壹對應的關系,為歸檔目錄數據庫與圖像文件的批量連接提供了條件。

3.認真填寫紙質文件數字化轉換過程交接登記表,記錄數據關聯後的頁數,檢查每次文件關聯後的頁數與文件整理掃描時填寫的頁數是否壹致。如不壹致,應註明具體原因和處理方法。

九、資料驗收

1,數據采樣

1)檢查所有已經采樣數字化的數據,包括目錄數據庫、影像文件、數據鉤子的整體質量。

2)對於全宗文件,數據驗收時的抽樣率不得低於5%。

2、驗收指標

1)當目錄數據庫與圖像文件有錯誤碼鏈接,或者目錄數據庫與圖像文件中有壹個存在不完整、不清晰、錯誤等質量問題時,抽檢標記為“不合格”。

2)全宗文件數字化轉換質量抽樣檢查合格率達到95%以上(含95%)時,視為“通過”。

合格率:通過抽樣檢驗的單據數/抽樣檢驗單據總數×100%。

3.驗收審查

“通過”驗收的結論必須經分管領導審核簽字後方能生效。

4.驗收登記

認真填寫紙質檔案數字化驗收登記表。

X.數據備份

1,備份範圍

完整、合格的數據應及時備份。

2.備份方法

為保證數據安全,備份載體的選擇應多樣化,可采用線上線下相結合的方式實現多套備份,並註意遠程存儲。

3.數據檢查

還應該檢查備份數據。備份數據的檢查主要包括備份數據是否可以打開,數據信息是否完整,文件數量是否準確。

4.備份標簽

數據備份後,對應的備份介質應進行標記,以便於查找和管理。

5.備份註冊

填寫紙質文件數字備份管理登記表。

XI。數字成果管理

1.應加強紙質檔案數字化成果的管理,確保其安全性、完整性和長期可用性。

2.提供紙質檔案數字化成果在線檢索利用時,應提供制作單位的電子標識,根據具體情況分別采用可下載或不可下載的數據格式。

  • 上一篇:大學生社會實踐隨筆
  • 下一篇:電梯噪音監管有法可依!《住宅設計規範》噪聲限值不是“裝修”
  • copyright 2024法律諮詢服務網