Umi-OCR 是一款开源免费的离线 OCR(光学字符识别)软件,支持截图OCR、批量图片识别、PDF文档识别、二维码生成与识别,能够去除水印、页眉和页脚等,所有代码开源,完全免费,解压即用,不需要联网。
1、截图OCR 通过快捷键唤起截图,识别图片中的文字。支持鼠标划选复制,识别记录栏可编辑文字,支持多记录复制,支持从剪贴板粘贴图片进行识别。
2、批量OCR 支持批量导入本地图片进行识别,支持的格式包括jpg、jpeg、png、webp、bmp、tif、tiff等。识别结果可保存为txt、jsonl、md、csv等格式,支持任务完成后自动关机或待机。
3、文档识别 支持PDF、XPS、EPUB、MOBI、FB2、CBZ等格式的文档识别。可对扫描件进行OCR,或提取原有文本,输出为双层可搜索PDF,支持设定忽略区域,排除页眉页脚的文字。
4、二维码 支持截图、粘贴或拖入本地图片,读取其中的二维码、条形码,支持一图多码。支持19种协议,包括Aztec、Codabar、Code128、Code39、Code93、DataBar、DataMatrix、EAN13、EAN8、ITF、LinearCodes、MatrixCodes、MaxiCode、MicroQRCode、PDF417、QRCode、UPCA、UPCE等,支持输入文本生成二维码图片,可设置纠错等级等参数。
5、文本后处理 提供多种排版解析方案,整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案包括多栏按自然段换行、多栏总是换行、多栏无换行、单栏按自然段换行、单栏总是换行、单栏无换行、单栏保留缩进、不做处理等。
6、忽略区域 在批量识别中,支持设置忽略区域,排除图片中的不想要的文字,通过绘制矩形框,忽略区域内的文字将在任务中被忽略。
Umi-OCR 的发布包为.7z压缩包或.7z.exe自解压包。解压后,点击Umi-OCR.exe即可启动程序,软件支持多国语言界面,首次打开时会根据系统设置自动切换语言,也可手动切换。
Umi-OCR 提供稳定版本的下载,可通过Scoop命令行安装程序进行安装。安装命令如下:
scoop bucket add extras
scoop install extras/umi-ocr
或
scoop install extras/umi-ocr-paddle
不要同时安装二者,快捷方式可能会被覆盖。可以额外导入插件,随时切换不同OCR引擎。
Umi-OCR v2 由一系列标签页组成,用户可根据需求打开需要的标签页。标签栏左上角可切换窗口置顶,右上角可锁定标签页,防止误触关闭,全局设置中可调整界面语言、主题、文字大小、字体等参数,支持一键添加快捷方式或设置开机自启。