0
点赞
收藏
分享

微信扫一扫

python - TXT章节文转为epub和mobi格式

caoxingyu 2022-11-23 阅读 94


 epub 格式其实是个zip文件,将epub文件,通过改名epub为zip,可以解压出来,会类似下面的文件目录结构。 反过来参考这个结构就能构造出epub文件了。 通过这个方式,我写了一个txt章节文(小说)转epub进一步转mobi的程序。   原来在 windows下面用easypub 这个小工具很不错的,后面转mac后一直没有找到一个简单的工具,于是自己动手做一个。

kindle不会吃灰了。

python - TXT章节文转为epub和mobi格式_html

下面是核心代码,可参考用。

#!/usr/bin/env python
# -*- coding: utf-8 -*-

# Project: wxepub
# File : main.py
# Author : Long.Xu <fangkailove@yeah.net>
# http://gnolux.blog.csdn.net
# QQ:26564303 weixin:wxgnolux
# Time : 2022/5/20 01:40
# Copyright 2022 Long.Xu All rights Reserved.
import os
import re
import zipfile

from jinja2 import Environment, FileSystemLoader


def txt2epub(save_as_path, text_file_path, cover_image_path, bookname, author):
"""
将文本文件转为epub格式
:param save_as_path: 保存epub的文件路径
:param text_file_path: 文本文件路径
:param cover_image_path: 封面图片路径
:param bookname: 书名
:param author:作者
:return:
"""
if os.path.exists(text_file_path):
print("开始转换文件")
with open(text_file_path, 'r') as f:
content = f.read()
# 英文章节
# regex = "^\s*Chapter\s*[0123456789IVX]*"
# 中文章节
regex = r"^\s*([第卷][0123456789一二三四五六七八九十零〇百千两]*[章回部节集卷].*)\s*"
splits = re.split(regex, content, flags=re.M)
items = [(splits[i], splits[i + 1]) for i in range(1, len(splits) - 1, 2)]
if len(items) > 0:
print("ok")
tmploader = FileSystemLoader(os.path.abspath('./template/'))
tmpenv = Environment(loader=tmploader)

book = zipfile.ZipFile(save_as_path, 'w')
# images

# container.xml
book.write('./template/META-INF/container.xml', 'META-INF/container.xml')

# text
nav = tmpenv.get_template("text/nav.html")
nav_html = nav.render(items=items, bookname=bookname)
book.writestr('text/nav.html', nav_html)
print(nav_html)
part = tmpenv.get_template("text/part.html")
index = 0
for item in items:
index += 1
part_html = part.render(item=item, index=index, bookname=bookname)
book.writestr('text/part%s.html' % index, part_html)

# content.opf
opf = tmpenv.get_template("content.opf")
content_opf = opf.render(items=items, bookname=bookname, author=author)
book.writestr('content.opf', content_opf)

# cover.jpeg
book.write('./template/cover.jpeg', 'cover.jpeg')
# mimetype
book.write("./template/mimetype", 'mimetype')
# page_styles.css
book.write('./template/page_styles.css', 'page_styles.css')
# stylesheet.css
book.write('./template/stylesheet.css', 'stylesheet.css')
# titlepage.xhtml
book.write('./template/titlepage.xhtml', 'titlepage.xhtml')

# toc.ncx
ncx = tmpenv.get_template("toc.ncx")
toc_ncx = ncx.render(items=items, bookname=bookname)
book.writestr('toc.ncx', toc_ncx)
print(toc_ncx)

book.close()

print("ok")
else:
print("源文件不存在")

pass


txt2epub('/Users/xulong/Downloads/冰与火之歌.epub', '/Users/xulong/Downloads/冰与火之歌.txt', '', bookname='书名', author='xulong')

 有了 epub 格式,再转mobi 只要 用 kindlegen 工具就可了。一个命令就能搞定。

举报

相关推荐

0 条评论