← 返回作品集

UmiOCR-AI-OCR-Plugin

UmiOCR 软件的多厂商 AI OCR 插件,集成 8 大主流 AI 模型商,支持多语言文字识别、坐标提取和版面保留。

项目类型
Python插件
开发语言
Python
版本
v1.0.0
许可证
开源

🛠️ 技术栈

Python AI OCR UmiOCR 多厂商API 文字识别 坐标提取 多语言 插件开发

✨ 核心功能

🚀 多厂商支持

一次安装,即可调用 8 家主流 AI OCR 模型,包括 OpenAI、Google Gemini、硅基流动、xAI Grok、阿里云百炼、火山引擎 Ark、DeepSeek、OpenRouter(Claude)。

🌍 多语言识别

支持中文、英文、日文、韩文、法文、德文、西班牙文、俄文、阿拉伯文等多种语言的文字识别。

⚡ 多模型选择

按需选择不同模型,兼顾速度与精度,满足不同场景的识别需求。

📍 坐标提取

可输出文字的位置信息,便于排版复原和精确定位。

🔧 灵活配置

支持 API 地址、密钥、模型、超时、代理等参数调整,适应多种使用环境。

🔄 自动回退

当前服务商不可用时,可自动切换到其他厂商,提高识别成功率。

📦 安装说明

  1. 确保已安装 Umi-OCR v2.0+ 版本
  2. 获取相应厂商的 API 密钥
  3. 将插件文件夹复制到 UmiOCR-data/plugins/ 目录
  4. 重启 UmiOCR 软件完成插件加载

📖 使用方法

  1. 在 Umi-OCR 中选择 "AI OCR(云端)" 功能
  2. 配置所需厂商的 API 密钥和模型参数
  3. 选择合适的 AI 模型和识别语言
  4. 开始进行多厂商高精度文字识别

🔗 相关链接