论文浅尝 | 消息传递神经网络真的有助于知识图谱补全吗？-CFANZ编程社区

一、神经网络简介

（一）神经元的工作原理

从百度百科上解释是：神经元即神经细胞，是神经系统最基本的结构和功能单位，分为细胞体和突起两部分，细胞体由细胞核、细胞膜、细胞质组成，具有联络和整合输入信息并传出信息的作用。突起有树突和轴突两种，树突短而分枝多，直接由细胞体扩张突出，形成树枝状，其作用是接受其他神经元轴突传来的冲动并传给细胞体；轴突长而分枝少，为粗细均匀的细长突起，常起于轴丘，其作用是接受外来刺激，再由细胞体传出。轴突除分出侧枝外，其末端形成树枝样的神经末梢。末梢分布于某些组织器官内，形成各种神经末梢装置，感觉神经末梢形成各种感受器；运动神经末梢分布于骨骼肌肉，形成运动终极。

简单来说就是信号从树突一端沿着轴突再传到树突，这样就从一个神经元传到另一个神经元。

（二）神经网络的工作机制

从百度百科上解释是：生物神经网络一般指生物的大脑神经元，细胞，触点等组成的网络，用于产生生物的意识，帮助生物进行思考和行动。人工神经网络（Artificial Neural Networks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（Connection Model），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。

简而言之是生物神经元可以接受许多输入,而不仅仅是一个输入，树突收集了这些电信号，将其组合形成更强的电信号。如果信号足够强，超过阈值，神经元就会发射信号, 沿着轴突，到达终端，将信号传递给下一个神经元的树突。

二、神经网络模型的输入输出值

神经网络模型的输入值是MNIST数据集，这个数据集是纽约大学YannLeCun教授开发，从MNIST数据集官网（http://yann.lecun.com/exdb/MNIST/，见图3 MNIST数据集官网截图信息）上明确信息如下：

1、数据集包含四个文件：训练集图片、训练集标签、测试集图片、测试集标签；

2、训练集来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查的工作人员. 测试集也是同样比例的手写数字数据；

3、训练集中包含6万张图片，测试集中包含1万张图片；

4、每个图片都是28*28像素大小的灰度图像，每个像素0~255。

每个 MNIST 图像是一个单一的手写的数字字符的数字化的图片（见图4 MNIST手写数字样本数据集）。每个图像是 28 x 28 像素大小，共计784个像素点，每个像素值是 0表示白色，255表示黑，范围0-255，中间像素值表示的灰度级。

首先打开其中一个MNIST数据集文件，第一个字符代表所显示的数字，后面的784个值代表的是第一个字符所显示数字的灰度值（见图5 记事本打开的MNIST数据集文件样例）。

然后从图片的角度展示输入值MNIST数据（见图6 展示MNIST数据集灰度值），每个图像是 28 x 28 像素大小，共计784个像素点，每个像素值是 0表示白色，255表示黑，范围0-255，中间像素值表示的灰度级，此784个像素点就是此神经网络模型的输入内容。

但是这个输入值的数字范围是从0-255，为了避免输入信号过大，导致过饱和，所以需要对每一个像素做归一化处理，最简单的归一化处理就是给每一个像素都除以255，把像素变成0.01-1之间的数字。所以本次神经网络模型的输入值是784个0.01-1之间的数字（见图7 神经网络模型中灰度值归一化处理后的输入值），同时输出值是经过算法模型判别后输出的0-9的10个数字。

三、构建模型