没有书签的电子书查阅起来挺不方便的。所以,在笔者看来,一本电子书没有了书签,感觉便没有了她的灵魂。
在本文,笔者将为大家推荐一款 PDF / PDG 电子书书签一键生成工具及其简易教程,希望人人都能看上有“灵魂”的电子书,嗯~
一、PdgCntEditor
Tips:
- 上面截图中的这个界面朴实的软件便是本教程的主角啦,百度搜索关键字:【老马的原创空间】可获得这位大侠的其他原创作品(app)哟!
- 本文不提供软件下载地址,也不会转载下载地址,有需求的请移步自行下载哈~
二、效果预览
在本教程,笔者将以《Unity官方案例精讲》为例教大家如何添加书签,请注意:请支持正版,电子档仅供参考。
三、实战演练
1. 如何获取书签源数据
序列 | 途径 | 备注 |
---|---|---|
a | 书籍网上商城 | 京东,亚马逊,当当,中国图书网 |
b | pdf上直接拷贝 | PDF不能是图片格式的页面(即:文字可直接拷贝) |
c | OCR文字识别技术 | 区域识别并保持排版格式的,笔者只用过Adobe Acrobat |
d | 呵呵哒 | 有些情况会把以上手段夹杂使用,做好心理准备 |
本例中,《Unity官方案例精讲》为扫描档,所以不能直接复制目录文字,谁不想拿现成的,So,笔者从亚马逊找到了这本书的详尽目录,但目录中居然没有页码,好吧,OCR技术还是要拿出来秀一下了!
下面我们使用OCR技术、Notepad++、Excel把页码与条目一一对应起来。
第一步:Adobe acrobat ORC获取页码部分数据(注意,复制页码的时候笔者是按住了Alt键的,识别错误的手动校正即可)
第二步:Notepad替换 " . " 获取“纯正”的页码,就是全局替换嘛~ (此步骤因目录内容而异,毕竟目录中可有可能出现 “ . ”号,可以使用正则表达式进行处理,在本文的扩展阅读第四条)
第三步:Excel 将页码与条目对应起来,就是复制粘贴嘛~Excel中处理可参照此教程
Tips:
- 这里笔者只拉取了一部分数据,其他数据拉取的操作都一样呢~
- 如果那些在线商城中提供的目录有页码,OCR这一步也可以省了呢!
2. 整理书签层级关系和页码
将Excel整理好的数据粘贴到notepad是上面截图中的样子,把它们粘贴到PdgCntEditor中并全选,然后点击图示按钮自动生成书签树,完成层级关系的整理。
效果如下:
这个时候,虽然看似每一行的末尾都制定了页码,但如果页码不是制表符分隔的情况下实际上是无效的,也就是点击了书签跳转不过去,我们继续全选这些书签数据,点击图示按钮分割页码数据。(本例中借助Excel整理的页码所以实际上是有效的)
由于点击后只是做了空白字符之间的替换操作,看不到很明显的效果,笔者就不截图啦。
3. 页码偏移处理
现在,保存一下这个书签,这个PDF里面就有了书签啦~
但是别高兴的的太早,书签可能有偏移呢,也就是点了书签确实跳了,但总是跳不到位置。
这个时候,你需要设置一个基准页,操作如图:
具体基准页面是哪一个?
答:看图中的页码是12,你有啥感想?没错,就是你想的那样,就是正文第一页的在文档中的实际页码,本例中正文的实际页码是12.
Tips:
- 有些扫描的电子书因为制作者会剔除空白页导致的页码偏移,就需要你加上空白页了。
-
在书签源数据中,正文以上(基准页以上)的页码请用负数表示,具体数据呢,自己数下页码就行。如下图:
四、扩展阅读:
一、 批量给pdf添加目录(最完整详细方法) - Ghoset的博客 (笔者注:Freepic2Pdf也是老马作品)
二、 PDF 补丁丁
三、老马的原创空间
四、使用正则表达式整理书签(本文的姊妹篇)
标签:PdgCntEditor怎么用的、可不可以很方便的添加pdf书签、PDF书签怎么批量导入呢、