自动化构音障碍严重程度分类:声学特征与深度学习技术的研究
文章目录
原文直达传送门:Automated Dysarthria Severity Classification:A Study on Acoustic Features and Deep Learning Techniques
思维导图
摘要
- 评估构音障碍的严重程度可以提供患者改善的见解,并协助治疗计划的制定。
- 本研究比较了使用各种深度学习架构和声学特征的构音障碍严重程度分类。
- 评估的架构包括:DNN、CNN、GRU 和 LSTM,使用基本特征如 MFCC 和 CQCC。
- 分析了来自韵律、发音、音质和声门功能的演讲障碍特定特征。
- 探索通过 i-向量实现低维特征表示,并使用 DNN 进行分类。
- 在说话者依赖情况中实现了 93.97% 的准确率,而在说话者独立情况下实现了 49.22% 的准确率。