UmiOCR 软件的多厂商 AI OCR 插件,集成 8 大主流 AI 模型商,支持多语言文字识别、坐标提取和版面保留。
一次安装,即可调用 8 家主流 AI OCR 模型,包括 OpenAI、Google Gemini、硅基流动、xAI Grok、阿里云百炼、火山引擎 Ark、DeepSeek、OpenRouter(Claude)。
支持中文、英文、日文、韩文、法文、德文、西班牙文、俄文、阿拉伯文等多种语言的文字识别。
按需选择不同模型,兼顾速度与精度,满足不同场景的识别需求。
可输出文字的位置信息,便于排版复原和精确定位。
支持 API 地址、密钥、模型、超时、代理等参数调整,适应多种使用环境。
当前服务商不可用时,可自动切换到其他厂商,提高识别成功率。
UmiOCR-data/plugins/ 目录