一.概述

论文及源码获取地址

图嵌入的获取一直都是一个研究热点，其可用于许多图相关的任务，包括链接预测、节点分类和可视化等等。在本篇论文中作者提出了一种名为VERSE的图嵌入（Embedding）生成方法，其从节点相似性的角度来考虑节点嵌入，提出了相关的优化目标。

VERSE的全称是VERtex Similarity Embeddings，该方法的特点是简单、通用和内存高效。

VERSE使用一个单层神经网络来学习嵌入，通过该方法能够有效的保留节点相似性。

VERSE在链接预测、节点分类、节点聚簇、图重建任务上都进行了相关实验并取得了较为理想的性能。

二.详细方法

2.1 优化目标

对于给定图 $G = (V, E)$ ，其中 $V = (v_1,...,v_n)$ 表示点集、 $\subseteq (V \times V)$ 为对应的边集，学习的目的是希望学得图节点的 $d$ 维表示向量，其中 $d < < n$ 。所有图节点的表示向量组成一个 $\times d$ 维的矩阵 $W$ ，其用 $W_v$ 来表示节点 $v$ 的嵌入。

$sim_G: V \times V \rightarrow \mathbb{R}$ 表示图的某种相似性，由于需要计算顶点与图中其它所有顶点的相似性，因此其需要满足分布:
$\sum_{u \in V} sim_G(v,u) = 1$
其中 $v$ 为图中任意节点。

$sim_E: V \times V \rightarrow \mathbb{R}$ 表示嵌入空间中节点间的相似性。

基于 $sim_G$ 和 $sim_E$ ，作者提出的优化目标是尽量减小两个分布间的KL散度，即：
$\sum_{v \in V} \mathrm{KL}\left(\operatorname{sim}_{\mathrm{G}}(v, \cdot) \| \operatorname{sim}_{\mathrm{E}}(v, \cdot)\right) \tag{1}$
作者通过图1中的例子来说明提出的优化目标的有效性，可以看出VERSE重建的矩阵更好的保留了相似性，可见其优化目标是有效的。

图1：相似性矩阵以及其VERSE和SVD重建版本

2.2 嵌入模型

假设来自某个分布 $\mathcal{P}$ 的节点 $u$ 和来自分布 $sim_G(u, \cdot)$ 的节点 $v$ ，从 $Q (u)$ 采集 $s < < n$ 个节点 $\tilde{v}$ ，NEC对应的损失利用logistic回归来最小化负对数似然：
$\mathcal{L}_{N C E}=\sum_{u \sim \mathcal{P}, \ v \sim \operatorname{sim}(\operatorname{G}, \cdot)} [\log \operatorname{Pr}_{W}\left(D=1 \mid \operatorname{sim}_{\mathrm{E}}(u, v)\right) + s \mathbb{E}_{\tilde{v} \sim Q(u)} \log \operatorname{Pr}_{W}\left(D=0 \mid \operatorname{sim}_{\mathrm{E}}(u, \widetilde{v})\right)]$
其中 $Pr_W$ 是根据 $W$ 计算得来的，具体为 $W_u$ 和 $W_v$ 经过点积后再代入sigmoid函数 $\sigma (x) = (1 + e^{-x}) ^ {-1}$ ，另外计算 $sim_E(u, \cdot)$ 时不需要进行归一化。随着噪声样本数量的增加，NCE计算的梯度可以证明收敛到交叉熵的梯度。借助NCE的渐近收敛保证，我们实际上是最小化了来自 $sim_G$ 的KL发散。NCE的理论保证取决于 $s$ ，但对于很小的值在实践中也能取得很好的结果。