40 秒内带你深入了解神经网络

人工智能2年前 (2023)发布 wangzhan
3,891 0
ChatGPT国内版

用数据动画说明超深度神经网络 (VDNN):一段 40 秒的视频,包含监督学习、层、神经元、模糊分类和卷积滤波器。

据说一图胜千言。在这里,我用一个视频来说明超深度神经网络(VDNN)的概念。

我使用监督分类问题来解释 VDNN 的工作原理。监督分类是监督学习中的主要算法之一。训练集有四组,每组分配不同的颜色。这里描述的 DNN 类型是卷积神经网络 (CNN):它依赖于过滤技术。在文献中,滤波器被称为卷积算子,因此被称为 CNN。

目的

目的是对训练集之外的任何新的或未来的数据点进行分类。在实践中,并不是使用整个训练集来构建分类器,而是使用称为测试集的子集来根据控制集检查性能并微调参数。控制集由不在测试集中的训练集点组成。这种类型的设计称为交叉验证。

视频中所示的分类器最终会立即对训练集之外的任何新点进行分类。此外,本文还阐述了分形(或模糊)分类的概念以及在 GPU(图形处理单元)中执行的机器学习。

描述

该方法由三个步骤组成。

步骤 1:将测试集转换为适合 DNN 输入的格式。这可能涉及对原始数据应用重新缩放或某种映射(通常是逻辑映射)。在我们的例子中,双变量数据被分箱并转换为像素位置以适合视频帧。视频的第一帧代表初始映射后的测试集。

步骤 2:一帧和下一帧之间的过渡,直到没有未分类(黑色)像素留下,如下所示。您可以将局部过滤器应用于每个像素,以分配其颜色(分配到的组),并使用相邻像素之间的多数投票。在此示例中,滤波器是非线性的。它类似于信号处理中通常使用的高通滤波器或图像增强滤波器。线性滤波器被称为平均滤波器或模糊滤波器,在这里没有用处。视频中的每一帧代表 DNN 的一层。它被称为非常深的神经网络,因为它涉及大量层(在本例中为数百层)。

步骤 3:一旦没有留下黑色像素(在视频中间),获得的帧就是 DNN 的输出。要对任何未来点进行分类,请使用步骤 1 中的映射计算其在图像上的像素位置,并找到为其分配的颜色。

下图是一个Gif图像,是通过将我的MP4视频转换为Gif格式获得的。每个像素在 DNN 术语中称为神经元,并且(就像在人脑中一样)仅与给定层中的相邻神经元交互。因此得名神经网络。

40 秒内带你深入了解神经网络

GPU 机器学习

由于所有机器学习装置都是使用标准过滤技术对图像执行的(一旦原始数据集转换为图像),因此很容易在视频存储器中运行算法。换句话说,在 GPU(图形处理单元)中完成它。我提到它是为了向不熟悉这项技术的人们解释和说明 GPU 机器学习的含义。

模糊或分形分类

一旦没有留下黑色(未分类)像素,分类器就完成了其任务。然而,在我的视频中,我添加了额外的帧来说明分形分类的概念。簇之间的边界有些多孔或模糊。靠近边界的点可以被分配给边界处的两个或三个相邻组中的任何一个。额外的帧(在 DNN 术语中称为层)显示了随时间变化的边界。它允许您通过查看其随时间变化的类分配来计算边界旁边的点属于一个组或另一个组的概率。我将在即将发表的文章中更详细地描述这一点。

结论

ai导航网这篇文章中,我深入浅出地解释了深度神经网络(DNN)、卷积神经网络(CNN)、卷积滤波器、神经网络的层和神经元、GPU机器学习和模糊分类的概念。

视频插图使用了异常大量的层(视频帧),每个神经元(像素)连接到很少的其他附近神经元(相邻像素)。因此,使用术语 “极深神经网络” 或“VDNN”。在我的示例中,每个神经元仅使用一个连接。它产生了一个非常细粒度的分类器,并提供了一些好处。但实际上,传统 DNN 使用的层数要少得多,但神经元却与数十或数百个其他神经元相连。换句话说,局部过滤器使用更大的窗口。

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...