最近用django+Vue实现了一个博客应用,原来的hexo的博客用着也挺好,想继续留着用,于是就想将hexo生成的.md的博客内容文件解析后直接写到django的博客数据库里做同步显示。
hexo生成的.md文件内容主要分两部分,一部分是博客的信息、一部分是博客内容,博客信息包括标题、目录、标签、发布日期等,博客内容就是具体博客写的内容主体了。
其中博客信息通过”—“来区分,夹在两个”—“块之间。博客的信息是yaml来描叙的需要解析并提取出相应的字段及内容,博客内容就更简单了直接是markdown描叙的不需要再解析了。
这里要做的事情就是提取两个”—“符号之间的内容,并解析相应的字段,提取两个”—“符号后面的内容作为博客的内容,形成字典,便于后面的入库。
代码示例如下:
yaml的解析可以直接用Python的PyYAML库
1 | pip install PyYAML |
1 | # -*- coding: utf-8 -*- |
效果:
可以看到hexo的md文件正确解析出来,形成字典。后续可以直接进行入库操作了。
Python的库还是很丰富实用的,用Python二十行代码就实现hexo的md文件格式解析。