【第三方MN插件】MN OCR,公式表格识别利器

Doc2x目前仅支持原始pdf文件转markdown

插件反馈

插件需要依赖MN Utils运行

插件下载:

  • 0.0.2:
    mnocr_v0_0_2.mnaddon (75.5 KB)
    1. 改进图片提取规则,修复部分场景图片提取错误以及合并摘录的图片没有识别到的问题
    2. 修复多空格未被正确合并导致MN无法渲染的问题
    3. 尝试支持自动转文字优先(配合MN Utils 0.0.7及往后版本)
    4. OCR报错改进
    5. 新增按钮OCR → EditorOCR→ChildNote
    6. 可被Toolbar控制logo开关
    7. 新增OCR结果缓存,同样的图片在同样的配置下直接返回缓存结果
    8. 适配新API,OCR → Excerpt基本不再需要额外手动操作
    9. 新增Doc2X PDF OCR,直接将整个PDF识别为一个markdown文档
    10. 修复PDF OCR导出按钮的问题
    11. 修复Toolbar中的OCR可能会导致默认OCR源被切换的问题
    12. 修复Toolbar中的OCR无响应的问题
    13. 优化拖拽逻辑
    14. 支持使用视觉AI模型进行OCR(除glm-4v-flash外需要保持订阅激活状态):
    • glm-4v-flash (免费)
    • GPT-4o
    • GPT-4o-mini
    • gemini-2.0-flash
    • gemini-2.0-pro
    • claude-3-5-sonnet-20241022
    • Moonshot-v1
    • glm-4v-plus
    • MiniMax-Text-01
    • abab6.5s-chat
    1. 继续修复按钮异常问题
    2. 修复doc2x刷新accessToken的问题
    3. 修复缓存功能的问题
    4. 修复无法切换OCR源的问题
    5. 部分UI调整
    6. 改进doc2x行间公式符替换逻辑
    7. 为doc2x和simpletex的图片OCR新增一个自定义action,目前仅支持replace
    8. 修复图片OCR结果缓存后再点击按钮replace不生效的问题
    9. 尝试修复偶发插件崩溃
    10. 尝试修复最近的玄学bug
    11. 尝试修复通过URL Scheme冷启动MN时的问题
    12. 自动替换\tag{1}等为(1)
    13. 修复按钮图片不显示的问题
    14. 适配Doc2X最新API,仅支持PDF OCR,同时移除图片OCR功能
    15. 改进提示逻辑
    16. AI OCR的prompt增加重置按钮
  • 0.0.1:
    mnocr_v0_0_1.mnaddon (64.5 KB)

一、Doc2X和simpleTex识别

先上演示

  1. 简单的文字OCR

CleanShot 2024-05-08 at 23.01.15.mp4

  1. 公式OCR

CleanShot 2024-05-08 at 22.42.45.mp4

  1. 表格OCR

CleanShot 2024-05-08 at 23.03.41.mp4

  1. 混合OCR

    两家看起来半斤八两

CleanShot 2024-05-08 at 23.12.46.mp4

CleanShot 2024-05-08 at 23.13.56.mp4

支持两家OCR提供商:Doc2X(目前只支持原始pdf文件转Markdown)和SimpleTex,功能上类似

Image.png

使用条件:

  1. 如果已经激活了MN Subscription,则可以直接使用,不需要在设置中填写apikey

    价格为每次OCR 消耗0.005$

  2. 使用自己的apikey

    在对应官网注册登录并复制apikey

    打开MN OCR,点击设置,在对应提供商页面下点击粘贴按钮即可

    • 对于Doc2X而言,会多出来一个refresh按钮,这是因为apikey实际上是refresh_token,需要一次刷新才能得到用于ocr的access_token。
    • 点击paste按钮时会自动执行一次refresh,以及每次MN冷启动后的第一次OCR请求也会自动刷新一次,因此一般情况下不需要手动刷新

Image.png

Doc2X(服务暂停): https://doc2x.noedgeai.com/user

SimpleTex(需要充值20才能使用): https://simpletex.net/user/center?menu=oapi

二、视觉大模型 OCR

  • 当前支持以下模型(除glm-4v-flash外需要订阅)
    • glm-4v-flash (免费)
    • GPT-4o
    • GPT-4o-mini
    • gemini-2.0-flash
    • gemini-2.0-pro
    • claude-3-5-sonnet-20241022
    • Moonshot-v1
    • glm-4v-plus
    • MiniMax-Text-01
    • abab6.5s-chat
  • 注意订阅下调用视觉AI是按量收费(可在Utils中查询使用记录)
    image
  • 支持自行配置prompt
    因此你甚至可以实现让AI直接翻译图片文字或者解析图片中的非文字内容
    image

三、其他:

  • 该插件同时为MN ChatAI提供了OCR能力
  • 可以被MN Toolbar直接调用
1 个赞

请问doc2x配置好api key之后,点击ocr->comment,出现no request可能是什么原因

先更新最新测试版

我也是这个问题,有解决吗,发现是什么问题了吗

SimpleTex是可以用的

没有,我更新到测试版后,ui好像都有点问题,配置不了api

我就是在4上面安装的可以用

能不能增加一下gpt4o的识别,很多情况simpletex识别没gpt4o好

找到了,订阅一下就好,贼好用,感恩~