分布式解决方案与实战-CFANZ编程社区

分布式解决方案与实战

前言

目前以深度学习对文本自动添加标点符号研究很少，已知的开源项目并不多，详细的介绍就更少了，但对文本自动添加标点符号又在古文识别语音识别上有重大应用。

基于此，本文开始讲解基于PaddleNLP的深度学习对文本自动添加标点符号的应用和研究，本文先讲解下，如何从PaddleSpeech提取通用的添加标点符号模型。

开始

一、PaddleSpeech的添加标点符号使用介绍

1、命令行 (推荐使用)
使用方法:
参数：

输出：

2、Python API

import paddle
from paddlespeech.cli.text import TextExecutor

text_executor = TextExecutor()
result = text_executor(
    text='今天的天气真不错啊你下午有空吗我想约你一起去吃饭',
    task='punc',
    model='ernie_linear_p7_wudao',
    lang='zh',
    config=None,
    ckpt_path=None,
    punc_vocab=None,
    device=paddle.get_device())
print('Text Result: \n{}'.format(result))

输出：

根据上面介绍，必须要安装PaddleSpeech的依赖包才可实现，代码量虽然很少，但依赖包太大。