paper: https://pure.hw.ac.uk/ws/portalfiles/portal/51022687/paper.pdf
Introduction
皮肤病变的准确描述容易发生专家间的可变性,这需要自动分割方法。在本文中,我们用一种新的图卷积层来处理超像素图来分割皮肤病变。
Methods
首先,简单线性迭代聚类(SLIC)算法[2]将输入图像分割为n个超像素,每个超像素约250像素。然后,我们在这些分区上形成一个区域邻接图( Region Adjacency Graph, RAG),这是所提议的网络的输入(图1)。输入特征是将以超像素质心为中心的50×50个图像补丁输入到卷积层的输出。
Positional Encoding。从超像素到中心像素的距离,归一化到区间(0,1),是按元素顺序添加到输入特征中的。
Graph-Context CNN (gc-CNN)。我们建立在图卷积网络[9]的基础上,
a是具有自环的邻接矩阵,D是它的度矩阵。在第l层,我们将n个特征映射的张量xl进行卷积,每个特征映射都有c通道、高度h和宽度w,以及一个可学习的核KΘ。折叠和展开操作用于使特征通过RAG进行传播。将它们放在一起,gc-CNN层可以写成:
其中∗为二维卷积运算,bΘ为可学习的偏置向量。将gc-CNN序列、ReLU非线性和层归一化(LN)[3]与特征提取块中的跳过连接[7]相结合。
Feature Extraction Block。该块(图1)包括残余块和过渡块。后半部分是空间维度,增加了信道维度,并通过重新利用相邻节点对应的特征映射来更新bA。它们的平均值,映射到范围((-1,1)与Tanh函数,并由参数β=0.001加权,被添加到bA的条目中。
MLP block。多层感知器(MLP)层分别为2048、1024、512、128、32、16和2个神经元,分别具有ReLU激活和LN[3],预测超像素的病变概率。
Training。如果一个超像素超过60%的像素在地面真实值3中有该值,则我们将其标记为病变。ADAM优化器[8]最小化了100个时代的交叉熵函数,学习速率为λ=5×10-3,批处理大小为1。
Post-processing。我们只保持最靠近图像中心的连接分量,这减少了在DermQuest中由照明梯度引起的误报。我们还应用了二进制打开和孔填充操作,这在ISIC-2017上很有用,尽管它降低了PH2上的性能(见图2)。