错误描述
之前已经有详细记录,python通过pypandoc,如何把markdown格式的文本,或者md扩展名文件,转换成为word或者pdf。
但一直不曾涉及markdown中包含图片链接的处理,此次需要完成包含图片的markdown内容转换成word以及pdf,能够在word和pdf中显示图片。
过程中,发生了一系列错误,主要如下
- docx文件打不开,提示内容信息发生错误
- 提示图片信息不存在
错误原因
- office版本问题,导致生成的docx不能正确打开
在我寻找到某一篇文章发现他有正常转换word显示图片时,我开始怀疑这一点,在查看生成的docx文件大小,发送给他人查看后,证实这一点 - pandoc的使用方式没领悟
markdown中有两种方式(至少我知道)表示图片的可以被pandoc转换。第一种,一个网页上的url,例如http://www.xxx.com/xxxx.jpg ,第二类,本地图片存放的路径位置。如下
第一种
![test.jpg](http://www.xxx.com/xxx.jpg)
第二种
![test2.jpg](picfile/xxxxx.jpg)
处理方式
正则替换成第二种方式,形如 picfile/xxxx.jpg
在原本markdown中保存的是url后缀,例如 http://127.0.0.1:81/picfile/xxxxx.jpg 中的/picfile/xxxxxx.jpg。
但是需要的是形容 picfile/xxxxx.jpg(服务器这边可以直接读取文件,此处不合适构成url http://127.0.0.1:81/picfile/xxxxx.jpg ),所以采用正则替换,在初次加工后再使用pandoc转格式。