← 返回作品集

UmiOCR-AI-OCR-Plugin

UmiOCR 软件的多厂商 AI OCR 插件，集成 8 大主流 AI 模型商，支持多语言文字识别、坐标提取和版面保留。

项目类型

Python插件

开发语言

Python

版本

v1.0.0

许可证

开源

🛠️ 技术栈

Python AI OCR UmiOCR 多厂商API 文字识别坐标提取多语言插件开发

一次安装，即可调用 8 家主流 AI OCR 模型，包括 OpenAI、Google Gemini、硅基流动、xAI Grok、阿里云百炼、火山引擎 Ark、DeepSeek、OpenRouter（Claude）。

支持中文、英文、日文、韩文、法文、德文、西班牙文、俄文、阿拉伯文等多种语言的文字识别。

按需选择不同模型，兼顾速度与精度，满足不同场景的识别需求。

可输出文字的位置信息，便于排版复原和精确定位。

支持 API 地址、密钥、模型、超时、代理等参数调整，适应多种使用环境。

当前服务商不可用时，可自动切换到其他厂商，提高识别成功率。

访问 GitHub 仓库下载源码报告问题