首先先让大家了解一下什么是OCR吧
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
现在我们来看看Nuance Omnipage Ultimate为什么是世界最好的OCR,它的辨识率超过 99%。
突出特点
快速开始
无缝分享文件
容易搜索
语言流利
其他特点
最强的辨识率 OmniPage 是目前世界上辨识率最高、辨识速度最快的辨识软件,辨识率比12.0版提高35%以上,整体辨识率高达99%以上,可以正确辨识各种图形 (包括Adobe PDF) 的文件,并扩大了医学及法律的字典。
支援Adobe PDF 文件辨识 可以设定 PDF 文件(包括影像档的文件)辨识的页数范围,直接辨识图形、文字和表格,将完整页面输出到 Word 文件,直接图文整合翻译。并可将扫描好的文件直接转存成可编辑格式的 PDF 文件。
单键自动辨识 只要一个按钮,便可自动完成分析、辨识、储存辨识好的文件,并可转换成可编辑的文字文件。自动解析表格、文字、图形,并且完整保留文件格式。
Microsoft Office 整合技术 直接在 Microsoft Word、Excel、PowerPoint 内建辨识、设定指令,辨识结果可以储存成 .doc .xls .htm .txt .tif .Rtf 多种格式。
可以辨识表格储存成试算表格式 全世界唯一可以与 Excel 试算软件结合的英文辨识软件。可将复杂的表格辨识转存为 .Xls 格式。
支援多国语言 支援最多语系的辨识软件,共支援119种文字,可以辨识法文、德文、义文、西班牙文、葡萄牙文、瑞典文…等等。
模拟人声发音 所有辨识好的文字都可以利用 Text-to-Speech 发音整篇文章来进行校稿动作。
重新切割区块辨识 提供区块重新切割功能,变更区块属性等再辨识功能,让您能够修正错误的辨识结果,以便利校对文稿。
设定页数及辨识范围
辨识 Adobe PDF 文件(包括影像档的文件)
将文件图形和影像直接转成Adobe PDF 文件
保留原始扫瞄文件的格式
轻松辨识表格、试算表
大幅提升低解析度影印稿及传真的文件辨识
支援双页同时辨识,大幅减少辨识时间
搭配任何厂牌的扫描器
有三个版本:
omniPage标准版
这是我们今天介绍的这版omniPage 终极版
omniPage服务器