广东振越智能家具有限公司—主营:密集架,智能密集架,电动密集架,档案密集架,是一家专注档案装具设备生产厂家。

index_06
ban

档案密集架纸质档案数字复制件光学字符识别(OCR)工作规范(三)

文章出处:密集架厂家    人气:    发表时间:2021-05-06 11:51:47

8 档案 OCR质量要求

8.1 识别准确率

8.1.1 档案 OCR对档案中文、数字、英文印刷体的识别准确率在95%以上。

8.1.2 档案 OCR对常用签名识别准确率达到90%以上,手写体识别准确率达到80%以上。

8.2 强抗噪能力

8.2.1 档案 OCR应当具备对噪点的强抵抗能力,识别过程中能够有效屏蔽较大程度的噪点干扰。

8.2.2 档案 OCR 应能准确判别纸质档案数字复制件上的污点、污线、黑边、纸张褪变斑点、水渍、污点、装订孔等,提高识别准确率。

8.3 识别速度

8.3.1 识别速度指标与识别准确率指标应同时适用。

档案密集架图

8.3.2 在主流计算机软硬件平台下,A4纸幅面中文识别速度不低于1000字/s,英文识别速度不低于2000字/s。

8.4 版面还原度

8.4.1 应实现复杂版面的精确还原,采用分栏技术,智能分析中文(简体、繁体)、英文字体,文、表、图混排文本,识别后无需人工干预,自动还原排版。

8.4.2 识别后的文档与原导入图像版面还原度应达到90%以上。

9 档案 OCR成果的管理与应用

9.1 成果管理

9.1.1 应保持档案 OCR成果各组成要素对应的纸质档案数字复制件、档案目录、元数据之间的逻辑层次和关联关系。

9.1.2 以纯文本形式保存的档案 OCR成果应使用档号作为文件名,可在存储载体中以档号为基础逐级建立层次文件夹单独保存,也可与纸质档案数字复制件统一保存。

9.1.3 支持全文检索的双层 PDF或 OFD文件可与对应的纸质档案数字复制件统一存储。数字档案馆(室)应用系统应记录并维护不同文件版本之间的联系。

档案密集架侧面图

9.1.4 档案 OCR成果文件管理权限应与纸质档案数字复制件相同。

9.1.5 OCR成果应与纸质档案数字复制件同步开展数据备份工作。

9.2 成果应用

9.2.1 档案 OCR成果应通过数字档案馆(室)应用系统实现全文检索,提高档案信息检索效率。

9.2.2 可发挥档案 OCR成果提取的归档信息和党政机关公文要素的作用,辅助开展档案自动著录、目录质量核查,以及纸质档案数字复制件挂接准确性核查等业务工作。

9.2.3 可利用档案 OCR成果,结合数据挖掘技术开展数据分析、知识管理、词库建设等工作。

密集架招标-振越集团
广东振越智能家具有限公司
振 越 集 团振 越 智 造
源头厂家一站式服务
办公家具定点供应商
国家高新技术企业
中标率高达90%

添加微信联系

138-2629-3157