0
点赞
收藏
分享

微信扫一扫

【知识】简单理解为何GCN层数越多越能覆盖多跳邻居聚合信息范围更广


背景说明

        大多数博客在介绍GCN层数时候,都会提到如下几点(经总结):

  • 在第一层,节点聚合来自其直接邻居的信息。
  • 在第二层,由于每个节点现在包含了其直接邻居的信息,它们在聚合直接邻居的特征时,也间接地聚合了二跳邻居的信息。
  • 这个过程可以继续进行,每增加一层,信息聚合的范围就扩大一跳

【知识】简单理解为何GCN层数越多越能覆盖多跳邻居聚合信息范围更广_图

        但我们看代码时候其实会发现,GCNCov内的操作其实是一样的,那它是如何通过叠加多层,就可以聚合多跳邻居的呢?

【知识】简单理解为何GCN层数越多越能覆盖多跳邻居聚合信息范围更广_图神经网络_02

如何理解

        其实我们需要明白一点就行:它是“间接”聚合。

        比如:

        第一层GCNCov时候,每个节点都能得到其一跳邻居的信息,并根据所有邻居的信息更新自己的信息。这个没有问题,很好理解。

当前节点的邻居,也包含了它自己的邻居信息。

间接地包含了二跳的邻居信息。

        因此,我们实际上也可以发现,在做这两次GCNCov时候,其一跳邻居的信息被利用了多次,会造成冗余。此外,随着层数的增加,由于“间接”也在增加,似乎越远的节点信息对当前节点的贡献也会变弱。

        此外,过多的层可能导致过度平滑(over-smoothing)问题,即不同节点的特征变得越来越相似,损失了区分度。

        因此,层数越多效果越差,似乎也可以解释了:

【知识】简单理解为何GCN层数越多越能覆盖多跳邻居聚合信息范围更广_网络_03

        最后,再画个图理解一下:

【知识】简单理解为何GCN层数越多越能覆盖多跳邻居聚合信息范围更广_图_04

举报
0 条评论