神经网络：什么是神经网络及其背后的历史 | Simio

作者：Matilda Adolphsen | 2021-11-3 4:00:00

会思考的机器 "或 "会思考的无生命实体 "的概念可追溯到古希腊的科学家们，他们试图让物体具有分析能力。然而，由于对人脑功能和神经活动的理解有限，古希腊人在实现思考机器方面的成功受到了严重限制。从构想出思维机器到绘制出人脑如何通过相连的脑细胞（也称神经元）产生复杂模式的图谱，需要几个世纪的时间。

Warren S. McCulloch 和 Walter Pitts 于 1943 年发表的研究论文《神经活动中蕴含的思想的逻辑计算》向世人介绍了大脑的神经活动。这两位合作者概述了神经系统中神经元相互发送信号以启动冲动的过程。该论文推测，一个神经元与成千上万个其他神经元相连，发送和接收不同数量的能量，一个神经元只有在达到阈值时才会发出能量。

这篇重要论文为将神经网络融入人工智能、机器学习和深度学习等 STEM 领域铺平了道路。这项研究为在计算机程序中利用神经网络使其能够独立识别模式和解决问题奠定了基础。

什么是神经网络？

神经网络通过模仿生物神经元在神经活动中的交流过程，反映了人类大脑的行为模式。在机器学习和深度学习领域，神经网络被称为人工神经网络（ANN）或模拟神经网络（SNN）。这些内涵突出表明，神经网络在这些领域的应用受到了人脑的启发。

人工神经网络由节点层组成，包括输入层、单个或多个隐藏层以及输出层。在这里，节点代表人工神经元，每个节点都有相关的权重和阈值。当单个节点的输出高于其定义的阈值时，该节点就会被激活，并将数据发送到其网络中的下一个节点层。反之，如果输出不超过节点的阈值，则不会向下一层节点网络发送数据。因此，神经元的特征可以定义为一个阈值逻辑单元（TLU），它输入不同的加权量，将这些量相加，一旦相加的量达到或超过其定义的阈值（θ），它就会输出一个量。

给输入量、阈值和输出等字符贴上标签，可以更好地理解神经网络的功能。例如，输入量及其权重分别标记为 X₁、X₂..._. _..、X n_和 W₁、W₂...._..W n_。这里，X 代表中子或节点的输入，W 代表其权重。因此，输入和权重之和为-X_！*W_！，这就得出了节点的激活水平（a）。使 a = (_X1*_W1) + (_X2*_W2) +...+ (_Xn*_Wn)。

在激活水平（a）等于或大于阈值（θ）的情况下，会产生输出（y），但如果激活水平小于θ，则不会产生输出。因此，必须达到或超过 Theta 才能激活神经元，向下一个节点层发送加权输出。

阈值逻辑单元如何学习

在人工智能应用中利用神经网络之前，必须对其进行训练，以提高其解决问题和做出决策的准确性。要提高神经网络的准确性，首先要深入了解阈值逻辑单元的学习过程。

那么，阈值逻辑单元是如何学习的，神经网络又是如何训练的呢？

简而言之，阈值逻辑单元通过不断改变权重和阈值来学习。较长的答案涉及监督和非监督训练过程。在有监督训练中，神经网络通过输入一系列实例进行训练：

待分类的各种项目和
为项目指定的正确分类

神经网络获取所提供的信息，并利用这些信息修改其权重，直到将项目与适当的分类相匹配。因此，神经网络会对输入和输出数据进行分析，从而得出将输入量与输出量相匹配的答案。

对于无监督训练，只需提供一系列待分类的项目或输入数据。神经网络会应用统计分析，找出输入数据集中的差异或异常。这意味着，无监督训练使神经网络能够处理数据并产生结果，而不需要任何影响网络分析方向的输出。

使用真实世界的场景有助于理解神经网络的学习方式。例如，可以训练一个奇异节点，让它使用二进制值分析车间是否需要增加设备。首先，假设有三个因素会影响它的决策：

是否有足够的容纳能力？(是 = 1，否 = 0）
需求是否证明有必要增加设备？(是 = 1，否 = 0）
是否有足够的资金？(是 = 1，否 = 0）

接下来，适用以下输入假设：

_X1= 1，有足够空间安装新设备
_X2= 0，需求不能证明需要新设备
_X3= 0，没有足够资金购买新设备。

接下来，必须为每项投入分配权重。权重越大，表示对最终决策的影响越大：

_W1= 3，因为空间对容纳新设备很重要
_W2= 5，需求对决定是否需要新设备至关重要
_W3= 2，如果急需新设备，可以随时筹集资金

最后，必须指定一个阈值，以确保神经网络对所提供的信息进行评估，从而得出正确答案。将所有这些值输入上述公式 "a = (_X1*_W1) + (_X2*_W2) +...+ (_Xn*_Wn)：

Y = (1 * 3) + (0 * 5) + (0 * 2) - 4 = -1.

最终计算结果为-1，小于产生输出所需的激活函数。因此，该节点的输出为 0。这意味着目前不需要或无法购买新设备。

这些示例中强调的神经网络训练是前馈训练，因为它们只朝一个方向流动--从输入到输出。反向传播是另一种用于训练神经网络的技术。对于反向传播，每个神经元的误差都包含在计算中，以便适当调整网络模型的参数。

查看完整帖子