广州振越是政府密集架定点供应商,专业从事智能密集架、电动密集架、密集档案柜、智能档案密集架定制生产厂家。

index_06
ty

档案密集架纸质档案数字复制件光学字符识别(OCR)工作规范(三)

文章出处:密集架厂家    人气:    发表时间:2021-05-06 11:51:47

8 档案 OCR质量要求

8.1 识别准确率

8.1.1 档案 OCR对档案中文、数字、英文印刷体的识别准确率在95%以上。

8.1.2 档案 OCR对常用签名识别准确率达到90%以上,手写体识别准确率达到80%以上。

8.2 强抗噪能力

8.2.1 档案 OCR应当具备对噪点的强抵抗能力,识别过程中能够有效屏蔽较大程度的噪点干扰。

8.2.2 档案 OCR 应能准确判别纸质档案数字复制件上的污点、污线、黑边、纸张褪变斑点、水渍、污点、装订孔等,提高识别准确率。

8.3 识别速度

8.3.1 识别速度指标与识别准确率指标应同时适用。

档案密集架图

8.3.2 在主流计算机软硬件平台下,A4纸幅面中文识别速度不低于1000字/s,英文识别速度不低于2000字/s。

8.4 版面还原度

8.4.1 应实现复杂版面的精确还原,采用分栏技术,智能分析中文(简体、繁体)、英文字体,文、表、图混排文本,识别后无需人工干预,自动还原排版。

8.4.2 识别后的文档与原导入图像版面还原度应达到90%以上。

9 档案 OCR成果的管理与应用

9.1 成果管理

9.1.1 应保持档案 OCR成果各组成要素对应的纸质档案数字复制件、档案目录、元数据之间的逻辑层次和关联关系。

9.1.2 以纯文本形式保存的档案 OCR成果应使用档号作为文件名,可在存储载体中以档号为基础逐级建立层次文件夹单独保存,也可与纸质档案数字复制件统一保存。

9.1.3 支持全文检索的双层 PDF或 OFD文件可与对应的纸质档案数字复制件统一存储。数字档案馆(室)应用系统应记录并维护不同文件版本之间的联系。

档案密集架侧面图

9.1.4 档案 OCR成果文件管理权限应与纸质档案数字复制件相同。

9.1.5 OCR成果应与纸质档案数字复制件同步开展数据备份工作。

9.2 成果应用

9.2.1 档案 OCR成果应通过数字档案馆(室)应用系统实现全文检索,提高档案信息检索效率。

9.2.2 可发挥档案 OCR成果提取的归档信息和党政机关公文要素的作用,辅助开展档案自动著录、目录质量核查,以及纸质档案数字复制件挂接准确性核查等业务工作。

9.2.3 可利用档案 OCR成果,结合数据挖掘技术开展数据分析、知识管理、词库建设等工作。

密集架招标-广州振越
招投标服务
微信联系
qrc1
QQ咨询
振 越 集 团振 越 集 团
中央国家定点供应商
广东省/市定点供应商
支持招投标项目合作
密集架首选品牌

dt点击咨询

138-2629-3157