Umi-OCR 开源免费的离线 OCR 软件，支持截图、批量导入图片、PDF文档识别，去除水印、页眉和页脚等

Umi-OCR 是一款开源免费的离线 OCR（光学字符识别）软件，支持截图OCR、批量图片识别、PDF文档识别、二维码生成与识别，能够去除水印、页眉和页脚等，所有代码开源，完全免费，解压即用，不需要联网。

主要功能

1、截图OCR 通过快捷键唤起截图，识别图片中的文字。支持鼠标划选复制，识别记录栏可编辑文字，支持多记录复制，支持从剪贴板粘贴图片进行识别。

2、批量OCR 支持批量导入本地图片进行识别，支持的格式包括jpg、jpeg、png、webp、bmp、tif、tiff等。识别结果可保存为txt、jsonl、md、csv等格式，支持任务完成后自动关机或待机。

3、文档识别 支持PDF、XPS、EPUB、MOBI、FB2、CBZ等格式的文档识别。可对扫描件进行OCR，或提取原有文本，输出为双层可搜索PDF，支持设定忽略区域，排除页眉页脚的文字。

4、二维码 支持截图、粘贴或拖入本地图片，读取其中的二维码、条形码，支持一图多码。支持19种协议，包括Aztec、Codabar、Code128、Code39、Code93、DataBar、DataMatrix、EAN13、EAN8、ITF、LinearCodes、MatrixCodes、MaxiCode、MicroQRCode、PDF417、QRCode、UPCA、UPCE等，支持输入文本生成二维码图片，可设置纠错等级等参数。

5、文本后处理 提供多种排版解析方案，整理OCR结果的排版和顺序，使文本更适合阅读和使用。预设方案包括多栏按自然段换行、多栏总是换行、多栏无换行、单栏按自然段换行、单栏总是换行、单栏无换行、单栏保留缩进、不做处理等。

6、忽略区域 在批量识别中，支持设置忽略区域，排除图片中的不想要的文字，通过绘制矩形框，忽略区域内的文字将在任务中被忽略。

使用方式

Umi-OCR 的发布包为.7z压缩包或.7z.exe自解压包。解压后，点击Umi-OCR.exe即可启动程序，软件支持多国语言界面，首次打开时会根据系统设置自动切换语言，也可手动切换。

下载与安装

Umi-OCR 提供稳定版本的下载，可通过Scoop命令行安装程序进行安装。安装命令如下：

scoop bucket add extras
scoop install extras/umi-ocr

或

scoop install extras/umi-ocr-paddle

不要同时安装二者，快捷方式可能会被覆盖。可以额外导入插件，随时切换不同OCR引擎。

界面与设置

Umi-OCR v2 由一系列标签页组成，用户可根据需求打开需要的标签页。标签栏左上角可切换窗口置顶，右上角可锁定标签页，防止误触关闭，全局设置中可调整界面语言、主题、文字大小、字体等参数，支持一键添加快捷方式或设置开机自启。

UniOCR通用OCR引擎，支持本地（macOS/Windows/Tesseract）和云服务，提供统一API

Umi-OCR 开源免费的离线 OCR 软件，支持截图、批量导入图片、PDF文档识别，去除水印、页眉和页脚等

微软Playwright MCP 网页自动化测试框架，支持跨浏览器Web测试

AI 有声书自动化生成工具

OI Wiki 编程竞赛知识库

OpenDeepSearch 开源搜索工具

WhatsApp MCP Server：连接Claude管理个人消息的AI工具

Flowise 零代码搭建AI应用

地图瓦片图下载工具，支持OpenStreetMap、天地图、谷歌地图、高德地图、腾讯地图、必应地图的XYZ瓦片图下载与合并

Pake打包工具：可将网页快速打包成桌面应用

XianyuAutoAgent 智能闲鱼客服机器人系统

漫画翻译器

Escrcpy ：基于 Scrcpy 的图形化安卓手机投屏+控制软件，支持Windows、macOS、Linux

插件化、定制化、无广告的免费音乐播放器 MusicFree

OCR工具

插件化、定制化、无广告的免费音乐播放器 MusicFree

Reubah 基于网页的图像处理与文档转换工具

Ward服务器监控工具

Escrcpy ：基于 Scrcpy 的图形化安卓手机投屏+控制软件，支持Windows、macOS、Linux

KrillinAI 基于LLMs的本地视频翻译、配音和语音克隆的工具

MarkitDown：可以将PDF，PPT，word，Excel、图片、音频、html、csv 等转化成Markdown格式

Together Open Deep Research由AI驱动的深度研究工具，能生成含引用的综合性报告

LLManager 用于管理审批请求的 LangGraph 工作流

Python A2A：Google A2A协议的Python实现，集成MCP，用于构建可互操作的多智能体系统

OpenAI.fm 基于 OpenAI Text-to-Speech 模型的交互式演示项目，使用 OpenAI Speech API 将文本转换成语音