18 年的时候了解到无纸化这个概念,于是买了 iPad 也买了 MN,不过使用 MN 并没有成为我的日常,再之后没多久 iPad 也吃起了灰…
最近因为看 PDF 增多,折腾来折腾去,最后又回到了 MN 的怀抱,不禁让我发出早知道还是 MN 的感慨…
1 PDF 相关
1.1 小科普
在网上下载的 PDF,通常有这三种情况
第一种:无法选中文字
第二种:可以选中但摘录出来的文字有错字或者选区位置对不上想摘录的文字
第三种:文字和选区都符合要求
不知道大家有没有学过类似 PS 这样的软件,在这类软件中有个图层的概念,在 PDF 中也有,可以百度双层 PDF 了解比较专业的解释,我个人的理解是 PDF 由多层构成,其中
- 扫描层:像复印一样从纸张、书本上获取的内容,可以把它当作一张图片
- 文本层:像在 word 中一样可以选中复制的文字,但文字颜色是透明的,盖在在扫描层上
扫描层肯定是有的,但文本层却不一定有,这样的 PDF 就是第一种无法选中文字的 PDF
如果通过软件直接导出、保存为可搜索 PDF(还有一个选项是保存为纯图像 PDF 就是第一种 PDF),比如 word 保存为 PDF,edge 浏览器 CTRL+P 打印另存为 PDF,因为由原始信息生成所以文本层可以准确的记录文字的内容和位置,这样的 PDF 就是第三种,第三种 PDF 的扫描层有着截图般的清晰度
但在我们的日常中,好像有一些扫描层不太清晰的 PDF 也有文本层可以进行复制搜索,这是因为我们可以使用一些软件对于第一种 PDF 来进行 OCR 文字识别添加一层文本层(文本层可以添加同样可以替换、删除),不过这样文本层文字内容和位置就全靠软件 OCR 算法准确度了,所以就有了第二种这种可以选中文字但内容或位置却偶尔有错误的 PDF
1.2 处理
当我们获得的 PDF 是第一种或者第二种时,通常它的来源是第三方制作,质量参差不齐,需要我们自己对 PDF 进行一些处理
1.2.1 添加文本层
我使用的是 Windows 系统电脑,通常用来进行 OCR 文字识别的软件有
ABBYY FineReader 15、Adobe Acrobat DC、福昕高级 pdf 编辑器
ABBYY FineReader 15 打开 PDF 文件,在上方工具栏的中央“识别(快捷键 Ctrl+Shift+R)”中即可进行 OCR(这里特意提一下是因为 ABBYY FineReader 15 安装完后有一个 OCR 编辑器,不是这个,OCR 编辑器的功能相当于用识别的文本层生成扫描层制作新的 PDF),ABBYY FineReader 15 支持多种语言,我用的到的中英识别较为准确,但它识别的速度极慢,而且遇到过文件页数过多直接崩溃导致源文件损坏,检查无误但在其他 PDF 阅读器中打开却有文本层偏移这样闹心的情况
Adobe Acrobat DC 和福昕高级 pdf 编辑器识别较快,但没有语言选择,准确率体感稍低一些,不过上面两个问题倒是没遇到过,当 ABBYY FineReader 15 制作文本层出错时,我会尝试用这两款软件
文本层的质量受到 PDF 排版、清晰度等的影响,通常纯文本类型的 PDF 不会有太多的问题,但上述这几款本地 OCR 软件在理工科 PDF 的复杂公式面前显得嬴弱无力,需要专门的公式识别软件或在线 OCR 来处理,这个稍后会提到,所以对于公式的识别只要能识别出位置信息就可以了,不强求准确率
1.2.2 去处水印等
如果需要去水印,那去水印的优先度要在添加文本层前,但因为水印千奇百怪,最优先的做法是找没有水印的 PDF,实在没办法才考虑去水印,一个软件添加的水印通常只能用这个软件进行去除,上面介绍的三个软件已经能涵盖大部分情况,三个都试一遍可以解决大多数的水印,如果还是去不掉,建议找质量更好的 PDF 或者接受水印
像一些纠偏、添加目录等小功能,直接百度搜更方便也直观
1.3 闲聊
PDF 文件能携带的内容很少,这是我踩过的一个小坑,想更换 PDF 阅读软件,从原软件导出才知道 PDF 本身能携带的信息极少,很多信息格式是软件帮忙存的,换软件就等于抛弃了很多精心修改的东西,比如我精心修改校对的摘录导出就是一个位置信息和这个位置上的 OCR 结果,修改的内容是没有的
我认为上面的关于 PDF 的小科普应该在接触 PDF 时就学会,然而我真不知道,论坛里也有相关的问题,在百度搜 PDF 推送的也是一些广告,等自己体会出来就太晚了
我的 PDF 里有文本层的也有没有文本层的,在之前我就是以为 PDF 有两种一种有文本一种没有再加上看的少,我还真没起过疑也没有去探究过,直到被一堆没有文本层的 PDF 折磨了一段时间,偶然得知才学到
当我重新使用 MN 才知道 MN 里 OCR PRO 就是我上面用的 ABBYY FineReader 15 的公司提供的(18 年我买了 MN 也直接买了 PRO,就没遇到过问题),而且在 MN 中 OCR PRO 相对 Windows 端的的识别更快我体感准确率也更高,虽然语言没有桌面端丰富,但是覆盖使用场景的话极建议购买!
PDF 是知识的承载,无需完美,尽量不要在处理 PDF 上花太多时间。
2 学习软件的选择
在最终决定使用 MN 前,我使用过这几个软件,应该也是大家一般会接触的
2.1 Markdown
看无文本层 PDF(此时我还不会处理 PDF),截图将比较重要的内容放入 markdown,但是截图一多 markdown 格式看着观感很差
看有文本层 PDF,以文字为主的 PDF 没有什么问题,但公式较多的 PDF 复制过来的数学公式就没有对的,需要自己修改 latex,虽然我找到了 Mathpix Snip 手写识别满足了需求,但还是太慢了,最终还不如截图,又回到观感问题…
但 Markdown 或这说类和 PDF 分离开的记笔记方式,最大的问题就是脱离了 PDF,学习阶段有时候看着 PDF 觉得简单就没记录的内容在后来复习的时候不会了,而记多了又成了抄书,而像数学这样需要手写,在纸上做完再录入或者拍照都说不出来的繁琐
我认为 Markdown 记笔记,更适合在做输出的阶段,而不是在输入的阶段
2.2 OneNote
后来学会了给 PDF OCR 识别,我就可以直接在 PDF 上进行标注,然后将题目截到 OneNote 上通过自带的 OneDrive 同步到 iPad 端手写,再给图片打标题标记对错等等方便搜索好复习,有一点儿麻烦,不过用了一小段时间倒也没什么问题
但此时在看一些偏向文科类的 PDF 时,又觉得批注只能线性的在一旁罗列,结构太散,又无法脱离PDF了,想要有思维导图来帮助梳理整理
2.3 BookxNote
这时候我已经也下回了 MN 尝试了一番,不过在搜索 MN 有无 Windows 版时发现了 bookxnote,电脑才是真正的生产力这个想法让我将 pdf 阅读软件转到了 bookxnote,在 bookxnote 中我发现它可以添加手写笔记(记不清楚是批注还是笔记了),我没有触控板鼠标写就有点鸡肋,当时我看着我的 iPad 还念叨你要是能当电脑的手写板就好了,数学我只能搭配 OneNote
2.4 Margin note
此时 MN 被我用来搭配欧路词典背单词,因为我发现 MN 搜索可以把搜到符合的内容以截图的形式展示,这样我可以方便的判断单词是在词条中还是搭配还是例句中,更快速的找到单词书上相对欧路词典中更简洁一些的释义
再接着我发现 MN 可以添加手写评论(在我记录时,MN 的手写评论页面长度需要先退出再进入加载更多),满足了我在上面提到的数学难题,直接框下数学题目写!
从BookxNote导出PDF到MN像上面提到的一样不少修改的摘录没法导出了,兜兜转转一圈,浪费了不少时间,早知道还是 MN !
2.5 总结
早期被安利MN,我其实没多大感觉,这次自己探索需求,才发现MN的好,我描述时简略了部分会遇到的问题和其他软件给与的解决方案,像URL跳转、PDF存储管理等,最终最符合我需求的是MN,在选择软件时记得明确自己的需求
3 我的 MN
MN是一款有些复杂,无法上手即用的软件,建议不要自己直接探索,找个教程过一下设置、功能再自己尝试使用会更高效,我安利这个比较详细的教程MarginNote 3 使用教程
我再强调一下,输入阶段做输入阶段的事情!
我自己使用的PDF大多是第二种处理出来的PDF,因此我在阅读时经常会遇到一些小错误,做笔记做导图时我忍不住的就想修改,改格式改错字,花费过大量时间
我也会为因为摘录面积过大,自己去精简句子构思语句
后来我觉得我复习的时间可能都没有这上面两步的时间久,在输入阶段做输出阶段的事情不是很明智,也因此我现在主要目标还是能用就行
3.1 重要功能
3.1.1 OhMyMN
Apple生态的软件相对还是有点封闭,MN可以安装插件真可以说是打开了一扇门(掀开了天花板),不过我推荐的教程里没有提及,目前我使用频率最高的插件是OhMyMN,它填补了 MN 的一些不足,它的文档写的很详细,而且使用过程中可以在插件面板中点击模块的简介进行跳转查看对应功能文档,我简单介绍一下功能
固定模块:
- OhMyMN:插件设置
- MagicAction for Card:选中脑图中的节点(节点=卡片)对节点进行操作,可执行的操作由可选模块提供,在可选模块中设置
- MagicAction for Text:选中PDF中的文字对文字进行操作,可执行的操作由可选模块提供,在可选模块中设置
可选模块总共13个功能,由大家在论坛反馈开发加入,每一个都能在符合的场景下发挥作用:
- Gesture:工具栏手势
注意要在弹出的工具栏上进行操作,我主要用它的单选卡片功能来设置标题,多选卡片功能来合并卡片 - Another AutoTitle:满足条件摘录转化为标题
一般不开启自动执行,辅助Gesture生成标题 - Another AutoDef:满足条件摘录提取部分为标题
开启自动执行,辅助Gesture生成标题 - AutoFormat:格式化摘录标题
开启自动执行,美化排版 - AutoComplete:单词词形补全至标题,意思查找填充摘录
开启自动执行,遇到不会的单词总得查一下! - AutoReplace:摘录满足条件替换其中内容
- AutoList:摘录中满足条件的位置添加换行
开启自动执行 - AutoTag:摘录满足条件节点添加标签
- AutoStyle:简单预设摘录颜色样式
- CopySearch:复制搜索节点内容
- AutoOCR:在线文字识别和公式转换
文字主要是给小语种使用,公式转换的KEY获取比较麻烦 - AutoTranslate:满足条件翻译,翻译结果填入评论
- AutoComment:添加修改时间或内容到评论
3.1.2 标题链接
目前很火的双链笔记打出的口号就是通过链接将零散的笔记链接起来,虽然 MN 中的标题链接不是双链,但它也让卡片可以一定程度上的联动复用
在 MN 中开启标题链接,如果当前 PDF 文字层中有和当前 PDF 所在脑图的标题一致的文字,就会有下划线标示,点击即可查看对应节点中的摘录评论
添加标题链接外部字典,如果当前 PDF 文字层中有和我们添加的脑图的节点的标题一致的文字,就会有下划线标示,点击即可查看对应节点中的摘录评论
3.1.2.1 使用
这个功能限定了有资格成为标题的文字,至少是还需要出现的重要内容,比如不认识的单词,还没背下来的 XX 公式等,这样的内容虽然比较少,但是很重要
OhMyMN中有很多关于标题的模块,主要就是来配合这个功能,不使用插件的话有外接键盘还好一点,纯手工输入基本是遭罪,使用上文提到的 Gesture、Another AutoTitle、Another AutoDef 由 PDF 的内容生成自然是最快的方式,我主要使用 Gesture,设置了卡片工具栏上下都为交换标题,在划取内容时就有意的划出想要作为标题的内容,而 Another AutoTitle、Another AutoDef 仅在接下来需要设置标题较多的或者满足条件较多时使用
3.1.2.2 补充
上面提到过,PDF 能携带的信息极少,如果为了能迁移而把内容放在评论里,不使用带不走的标题,就错过了标题链接(应该没有人不用),而且现在插件越来越多,也比如 Obsidian-Bridge 就可以将更多的内容导出到 Obsidian,放弃依靠 PDF 携带信息吧!
早期我有一点强迫症不想在摘录里添加不是摘录的内容的东西,后来也觉得摘录是 PDF 的概念,但制作的脑图是要超出 PDF 的,不应该被 PDF 限制,让脑图更好服务就行~
3.1.3 默认颜色
摘录快捷颜色只有四种,如果要使用第五种颜色,需要多一次点击,如果不在设置里锁定快捷颜色,这极少使用的第五种颜色会顶掉一种常用色,在多一次点击的情况下轮回一遍四种常用色才会恢复,这样多少是有点繁琐,所以我锁定了四种常用色,颜色的分配可以参考四色笔记法_百度百科 ,我这样设置:
灰:大纲
绿:过眼即可
蓝:需要思考,还想再看一看
红:重视重复
3.2 我的使用
我以英语学习和数学学习举下栗子
3.2.1 英语学习
3.2.1.1 搭配欧陆词典(已淘汰)
安装插件 search in eudic,该插件在我们选择单词时自动打开欧路词典搜索单词,在欧路中开启自动加入生词本,这样就完成了记录
3.2.1.2 AutoComplete,让 MN 化身点读机!
AutoComplete+标题链接的点读效果太棒了,更新后的 AutoComplete 制卡更方便了再加上 AutoTranslate 搭配 anki,梦中情流程,大家看这位大佬的分享
【OhMyMN 使用技巧分享】制作Anki单词卡(划词制卡+原句翻译) - Anki专区——记忆宫殿 - MarginNote 中文社区
不过他在演示中好像没有提到标题链接,记得打开!刚刚的生词也没这么快记下,后面遇到就有提示,不用重复划了(大佬说已更新)
3.2.2 数学学习
公式等搭配标题链接功能即可
做题:直接使用矩形选区框选题目加入脑图,手指双击图片格式的摘录可以直接进入编辑面板(焦点),打开左上角的手写输入,进入编辑面板自动全屏(这里提一下,想要加载新页面需要先退出一下再进编辑面板),设置颜色标记题目对错,后期筛选复盘