本书介绍
近年来,在自动处理文本和口语数据的需求推动下,自然语言处理和计算语言学领域持续增长。凭借现在可用的处理能力和技术,研究正从实验室原型扩展到现实世界的成熟应用。
本书首先讲解自然语言处理的原理,涵盖实用语言学问题,如编码和注释方案,定义单词、标记和词性和形态学,以及机器学习中的关键概念,如熵、回归和分类,这些概念在整本书中都有使用。然后详细介绍了所涉及的语言处理功能,包括使用规则和随机技术的词性标注、使用Prolog编写阶段结构语法、句法形式和解析技术、语义、谓词逻辑和词汇语义以及话语分析和在对话系统中的应用。本书的一个关键特点是作者从头到尾都是亲自动手的,有Prolog和Perl中的示例代码、大量的练习以及对Prolog的详细介绍。
本书目录
内容截图