IronOCR : .Net 5 和 Azure 功能改进
IronOCR 2021.9.0 版本已经发布:
版本 2021.9.0 功能和升级
· 错误修复:Azure 函数兼容性
· 错误修复:适用于只读 OCR 字典
· 错误修复:现在适用于 .Net 5.07
· 错误修复:从项目配置文件中读取许可证密钥(边缘情况)
· 功能:添加到 OcrInput 的颜色替换方法
· 功能:从 TIFF 和 PDF 文件加载特定帧
· 改进:更新了 System.Drawing.Common
C# OCR 库
# 从图像中读取文本和条形码。 .NET 中的 OCR PDF
# OCR 支持多种国际语言
# 输出为纯文本字符串或结构化数据
专为在 .NET 5、Core、Standard 或 Framework 上运行的 C#、F# 和 VB.NET 设计
兼容性
C#
VB.NET
F#
.NET 5
.NET Core 2x & 3x
.NET Standard 2
.NET Framework 4x
Console, Web, & Desktop
Microsoft Windows
Linux (Debian, CentOS, Ubuntu)
MacOs
Docker (Windows, Linux, Azure)
Azure (VPS, Webapps, Websites, Fuctions)
Microsoft Visual Studio
Jetbrains ReSharper & Rider
OCR引擎
127 种语言
高、中、快质量
自定义语言和单词列表
Tesseract 5 (自定义 .NET Engine)
Tesseract 4
Tesseract 3
同时结合多个 OCR 引擎以提高准确性
>20 条码格式
二维码
收据
检查
发票
多线程、单线程、异步
OCR输入
图像(jpg、png、gif、tiff、bmp)
多页 Gif 和 Tiff
System.Drawing 对象
流
增强分辨率(自动或手动)
二进制化
对比度和自动对比度
纠偏(修复旋转和透视)
去噪
扩张
反转
转为灰度
锐化
旋转
OCR输出
.NET文本字符串
条形码和QR数据及图像
页面
块状
段落
线条
字数
字符
可搜索的PDF文件
hOCR/HTML输出
任何页面、文本元素或条形码的图像