《设计模式》— 行为型模式 — 访问者模式
一、动机
考虑一个编译器,它将源程序表示为一个抽象语法树。该编译器需要在抽象语法书上实施某些操作以进行”静态语义“分析,例如检查所有的变量是否都已经被定义了。它也需要生成代码。因此它可能要定义许多操作以进行类型检查、代码优化、流程分析,检查变量是否在使用前被赋值等。此外,还可以使用抽象语法树进行格式梅花、程序重构、静态分析等功能。
这些操作大多要求对不同的节点进行不同的处理。例如,对代表赋值语句的节点的处理就不同于对代表变量或者算术表达式节点的处理。因此有用于赋值语句的类,有用于变量访问的类,还有用于算式表达式的类,等等。节点类的集合当然依赖于被编译的语言,但对于一个给定的语言其变化不大。
考虑下图所示的 Node 层次结构:
这里的问题是,将所有这些操作分配到各种节点类中会导致整个系统难以理解、难以维护和修改。将类型检查代码和代码生成功能放在一起,将产生混乱。此外,增加新的操作通常需要重新编译所有这些类。如果可以独立地增加新的操作,并且使这些节点类独立与作用于其上的操作,将会更好一些。
要实现上述两个目标,我们可以将每一个类中相关的操作包装在一个独立的对象中,并在遍历抽象语法树时将此对象传递给当前访问的元素。当一个元素“接受”该访问者时,该元素向访问者发送一个包含自身类信息的请求。该请求同时也将该元素本身作为一个参数。然后访问者将为钙元素执行该操作 —— 这一操作以前是在该元素的类中的。
例如,一个不使用访问者的编译器可能会通过在它的抽象语法树上调用 typeCheck 操作对一个过程进行类型检查。每一个节点将调用它的成员的 typeCheck 以实现自身的 typeCheck。如果该编译器使用访问者对一个过程进行类型检查,那么它将会创建一个 TypeCheckingVisitor 对象,并以这个对象为参数在抽象语法树上调用 accept 操作。每一个节点在实现 accept 时将会回调访问者:一个赋值节点调用访问者的 VisitAssignment 操作,而一个变量引用将调用 VisitVariableReference。类 AssignmentNode 的 typeCheck 操作现在称为 TypeCheckingVisitor 的 VisitAssignment 操作。
为使访问者不仅仅做类型检查,我们需要所有抽象语法树的访问者you一个抽象的父类 NodeVisitor。NodeVisitor 必须为每一个节点类定义一个操作。一个需要计算程序度量的应用将定义 NodeVisitor 的新的子类,并且将不再需要在节点类中增加与特定应用相关的代码。Visitor 模式将每一个编译步骤的操作封装在一个与该步骤相关的 Visitor 中。
使用 Visitor 模式,必须定义两个类层次:一个对应于接受操作的元素(Node 层次),另一个对应于对元素的操作的访问者(NodeVisitor 层次)。给访问者类层次增加一个新的子类即可创建一个新的操作。只要该编译器接受的语法不改变(即不增加新的子类),我们就可以简单地定义新的 NodeVisitor 子类以增加新的功能。
二、适用性
- 一个对象结构包含很多类对象,它们有不同的接口,而你想对这些对象实施一些依赖于其具体类的操作。
- 需要对一个对象结构中的对象进行很多不同且不相关的操作,而你想避免让这些操作污染这些对象的类。Visitor 使得你可以将相关的操作集中起来定义在一个类中。当该对象结构被很多应用共享时,用 Visitor 模式让每个应用仅包含需要用到的操作。
- 定义对象结构的类很少改变,但经常需要再次结构上定义新的操作。改变对象结构类需要重定义对所有访问者的接口,这可能需要很大的代价。如果对象结构类经常改变,那么可能还是在这些类中定义这些操作比较好。
三、结构
四、参与者
1、Visitor
为该对象结构中 ConcreteElement 的每一个类声明一个 visit 操作。该操作的名字和特征表示了发送 visit 请求给该访问者的类。这使得访问者可以确定正被访问元素的具体的类。这样访问者就可以通过该元素的特定接口直接访问它。
2、ConcreteVisitor
实现每个由 Visitor 生命的操作。每个操作实现本算法的一部分,而该算法片段是对应于结构中对象的类。ConcreteVisitor 为该算法提供了上下文并存储它的局部状态。这一状态常常在遍历该结构的过程中累计结果。
3、Element
定义一个 accept 操作,它以一个访问者为参数。
4、ConcreteElement
实现 accept 操作。
5、ObjectStructure
- 能枚举它的元素
- 可以提供一个高层的接口以允许该访问者访问它的元素
- 可以是一个组合或是一个集合,如一个列表或一个无序集合。
五、协作
六、效果
1、访问者模式使得易于增加新的操作
访问者使得增加依赖于复杂对象结构的构件的操作变得容易了。仅需增加一个新的访问者即可在一个对象结构上定义一个新的操作。相反,如果每个功能都分散在多个类之上的话,定义新的操作时必须修改每一个类。
2、访问者集中相关的操作而分离无关的操作
相关的行为不是分布在定义该对象结构的各个类上,而是集中在一个访问者上。无关行为却被分别放在各自的访问者子类中。这就既简化了这些元素的类,也简化了在这些访问中定义的算法。所有与其算法相关的数据结构都可以被隐藏在访问者中。
3、增加新的 ConcreteElement 类很困难
Visitor 模式是的难以增加新的 Element 子类。每添加一个新的 ConcreteElement 都要在 Visitor 中添加一个新的抽象操作,并在每一个 Concrete 类中实现相应的操作。有时可以在 Visitor 中提供一个缺省的实现,这一实现可以被大多数的 ConcreteVisitor 继承,但这与其说是一个规律还不如说是一种例外。
所以在应用访问者模式时考虑的关键问题是系统的哪个部分会经常变化,是作用于对象结构上的算法还是构成该结构的各个对象的类。如果总是有新的 ConcreteElement 类加入进来的话,Visitor 类层次将变得难以维护。在这种情况下,直接在构成该结构的类中定义这些操作可能更容易一些。如果 Element 类层次是稳定的,而你不断的增加操作或修改算法,访问者模式可以帮助你管理这些活动。
4、通过类层次进行访问
一个迭代器可以通过调用节点对象,同时访问这些对象。但是迭代器不能对具有不同元素类型的对象结构进行操作。一个迭代器及其访问接口的定义如下:
template <class Item>
class Iterator {
Iterm currentItem();
}
这就意味着该迭代器能够访问的所有元素都有一个共同的父类 Item。
访问者没有这种限制。它可以访问不具有相同父类的对象。可以对一个 Visitor 接口增加任何类型的对象。
5、累积状态
当访问者访问对象结构中的每一个元素时,它可能会类及状态。如果没有访问者,这一状态将作为额外的参数传递个进行遍历的操作,或者定义为全局变量。
6、破坏封装
访问者方法假定 Concrete 接口的功能足够强,足以让访问者进行其工作。结果是,该模式常常迫使你提供访问元素内部状态的公共操作,这可能会破坏它的封装性。
七、实现
1、双分派
访问者模式允许你不改变类即可有效地增加其上的操作。为达到这一效果使用了一种称为双分派的技术。这是一种很著名的技术。事实上,一些编程语言甚至直接支持了这一技术。C++中只支持单分派。
在单分派语言中,到底由哪种操作来实现一个请求取决于两个方面:该请求的名字和接受者的类型。例如,一个 generateCode 请求将会调用的操作取决于你请求的节点对象的类型。在C++中,对一个 VariableRefNode 实例调用 generateCode 将调用 VariableRefNode::generateCode,而对一个 AssignmentNode 调用 generateCode 将调用 AssignmentNode::generateCode。所以最终哪个操作得到执行依赖于请求的种类和接受者的类型两个方面。
双分派的技术我们在 《More Effictive C++》学习笔记 — 技术(六) 讨论过。
这也是 Visitor 模式的关键所在:得到执行的操作不仅取决于 Visitor 的类型还取决于它访问的 Element 的类型 。可以不将操作静态地绑定在 Element 接口中,而将其安防在一个 Visitor 中,,并使用 accept 在运行时绑定。扩展 Element 就等于定义一个新的 Visitor 子类而不是多个新的 Element 子类。
2、谁负责遍历对象结构
一个访问者必须访问这个对象的每一个元素。问题是,它怎样做?我们可以将遍历的责任放到下面三个地方中的任意一个:对象结构中,访问者中,一个独立的迭代器对象中。
通常由对象结构负责迭代。一个集合只需要对它的元素进行迭代,并对每一个元素调用 accept 操作。而一个组合通常让 accept 操作遍历该元素的各子构件并对他们中的每一个递归地调用 accept。