是指通过电子设备检测纸质文档中的字符,利用图像处理与模式识别技术将文字转换为可编辑文本的计算机视觉技术。其流程包含图像预处理、文本检测、字符识别等核心模块,其中提升识别正确率的ICR(智能字符识别)是其重要课题。2020年9月,国内首份智能文字识别能力测评与应用白皮书正式发布。
OCR技术已在零售、政务、工业、金融等多个行业实现应用落地。该技术已应用于保险理赔全流程智能化处理,显著提升赔付速度。在古籍数字化领域,OCR作为核心工具支持大规模协同校对,2025年,“我用AI校古籍”项目利用OCR技术协同3.7万名志愿者完成15亿字古籍粗校。2026年,上海图书馆启动馆藏文献元数据及全文OCR数据制作项目,预算达580万元。在企业软件服务领域,普联软件利用OCR技术处理复杂个性化单据和报表,以提升数据处理效率与准确性。2026年,云知声发布Unisound U1-OCR文档智能基础大模型,该模型采用ViT+LLM架构(视觉部分为NaViT),推动了OCR技术向3.0时代的演进。
OCR技术自20世纪60年代发展至今,经历了从模板匹配到深度学习的技术迭代。
![]()
扫二维码
关注我们
不迷路^_^
我们愿景
城市更繁荣
乡村更美丽