文章目录
0 引入
0.1 题目
AAAI2022:使用MaxSAT优化二元决策图进行分类 (Optimizing binary decision diagrams with MaxSAT for classification)
0.2 背景
关键决策下的可解释人工智能 (explainable artificial intelligence, XAI) 的发展,促使了可解释机器学习 (machine learning, ML) 模型的探索。事实上,由于它们的内在结构,尤其是小尺寸,使得这些模型在本质上可被人类理解。近年来,一些计算此类模型的精确方法被相继提出,以提供更紧凑的模型或更好的预测质量来弥补传统启发式方法的不足。
然而,尽管它们对布尔函数 (Boolean functions)进行了压缩表示,但二元决策图 (binary decision diagrams, BDDs) 并没有像其他可解释 ML 那般获取足够的关注。
0.3 方法
1)提出了基于SAT的模型,用于根据特征数量学习对所有输入示例进行分类的最佳BDDs;
2)提升编码到MaxSAT模型,以学习有限深度内的最佳BDDs,从而最大限度地增加正确分类的示例数量;
3)合并通过MaxSAT模型找到的 BDD 的兼容子树来解决碎片问题;
4)与前沿方法相比,综合实验展示了我们算法在预测性能和可解释性上的巨大优势。
1 技术背景
给定包含
M
M
M个示例的数据集
E
=
{
e
q
,
…
,
e
M
}
\mathcal{E}=\{e_q,\dots,e_M\}
E={eq,…,eM}。每个样本
e
q
∈
E
e_q \in \mathcal{E}
eq∈E被描述为二元特征的列表
L
q
=
[
f
1
,
…
,
f
K
]
\mathcal{L}_q=[f_1,\dots,f_K]
Lq=[f1,…,fK],其相应二元标签为
c
l
q
cl_q
clq,