训练卷积神经网络：什么是机器学习？——第二部分|天天即时

首页 > 聚焦 >

训练卷积神经网络：什么是机器学习？——第二部分|天天即时

发表时间：2023-04-19 06:52:01 来源：ADI

摘要

本文是系列文章的第二部分，重点介绍卷积神经网络（CNN）的特性和应用。CNN主要用于模式识别和对象分类。在第一部分文章《卷积神经网络简介：什么是机器学习？——第一部分》中，我们比较了在微控制器中运行经典线性规划程序与运行CNN的区别，并展示了CNN的优势。我们还探讨了CIFAR网络，该网络可以对图像中的猫、房子或自行车等对象进行分类，还可以执行简单的语音识别。本文重点解释如何训练这些神经网络以解决实际问题。

(资料图片仅供参考)

神经网络的训练过程

本系列文章的第一部分讨论的CIFAR网络由不同层的神经元组成。如图1所示，32 × 32像素的图像数据被呈现给网络并通过网络层传递。CNN处理过程的第一步就是提取待区分对象的特性和结构，这需要借助滤波器矩阵实现。设计人员对CIFAR网络进行建模后，由于最初无法确定这些滤波器矩阵，因此这个阶段的网络无法检测模式和对象。

为此，首先需要确定滤波器矩阵的所有参数，以最大限度地提高检测对象的精度或最大限度地减少损失函数。这个过程就称为神经网络训练。本系列文章的第一部分所描述的常见应用在开发和测试期间只需对网络进行一次训练就可以使用，无需再调整参数。如果系统对熟悉的对象进行分类，则无需额外训练；当系统需要对全新的对象进行分类时，才需要额外进行训练。

进行网络训练需要使用训练数据集，并使用类似的一组测试数据集来测试网络的精度。例如CIFAR-10网络数据集为十个对象类的图像集合：飞机、汽车、鸟、猫、鹿、狗、青蛙、马、轮船和卡车。我们必须在训练CNN之前对这些图像进行命名，这也是人工智能应用开发过程中最为复杂的部分。本文讨论的训练过程采用反向传播的原理，即向网络连续展示大量图像，并且每次都同时传送一个目标值。本例的目标值为图像中相关的对象类。在每次显示图像时，滤波器矩阵都会被优化，这样对象类的目标值就会和实际值相匹配。完成此过程的网络就能够检测出训练期间从未看到过的图像中的对象。

图1.CIFAR CNN架构。

图2.由前向传播和反向传播组成的训练循环。

过拟合和欠拟合

在神经网络的建模过程中经常会出现的问题是：神经网络应该有多少层，或者是神经网络的滤波器矩阵应该有多大。回答这个问题并非易事，因此讨论网络的过拟合和欠拟合至关重要。过拟合由模型过于复杂以及参数过多而导致。我们可以通过比较训练数据集和测试数据集的损失来确定预测模型与训练数据集的拟合程度。如果训练期间损失较低并且在向网络呈现从未显示过的测试数据时损失过度增加，这就强烈表明网络已经记住了训练数据而不是在实施模式识别。此类情况主要发生在网络的参数存储空间过大或者网络的卷积层过多的时候。这种情况下应当缩小网络规模。

损失函数和训练算法

学习分两个步骤进行。第一步，向网络展示图像，然后由神经元网络处理这些图像生成一个输出矢量。输出矢量的最大值表示检测到的对象类，例如示例中的“狗”，该值不一定是正确的。这一步称为前向传播。

目标值与输出时产生的实际值之间的差值称为损失，相关函数则称为损失函数。网络的所有要素和参数均包含在损失函数中。神经网络的学习过程旨在以最小化损失函数的方式定义这些参数。这种最小化可通过反向传播的过程实现。在反向传播的过程中，输出产生的偏置（损失 = 目标值-实际值）通过网络的各层反馈，直至达到网络的起始层。

因此，前向传播和反向传播在训练过程中产生了一个可以逐步确定滤波器矩阵参数的循环。这种循环过程会不断重复，直至损失值降至一定程度以下。

优化算法、梯度和梯度下降法

为说明训练过程，图3显示了一个包含x和y两个参数的损失函数的示例，这里z轴对应于损失。如果我们仔细查看该损失函数的三维函数图，我们就会发现这个函数有一个全局最小值和一个局部最小值。

目前，有大量数值优化算法可用于确定权重和偏置。其中，梯度下降法最为简单。梯度下降法的理念是使用梯度算子在逐步训练的过程中找到一条通向全局最小值的路径，该路径的起点从损失函数中随机选择。梯度算子是一个数学运算符，它会在损失函数的每个点生成一个梯度矢量。该矢量的方向指向函数值变化最大的方向，幅度对应于函数值的变化程度。在图3的函数中，右下角（红色箭头处）由于表面平坦，因此梯度矢量的幅度较小。而接近峰值时的情况则完全不同。此处矢量（绿色箭头）的方向急剧向下，并且由于此处高低差明显，梯度矢量的幅度也较大。

图3.使用梯度下降法确定到最小值的不同路径。

因此我们可以利用梯度下降法从任意选定的起点开始以迭代的方式寻找下降至山谷的最陡峭路径。这意味着优化算法会在起点计算梯度，并沿最陡峭的下降方向前进一小步。之后算法会重新计算该点的梯度，继续寻找创建一条从起点到山谷的路径。这种方法的问题在于起点并非是提前定义的，而是随机选择的。在我们的三维地图中，某些细心的读者会将起点置于函数图左侧的某个位置，以确保路径的终点为全局最小值（如蓝色路径所示）。其他两个路径（黄色和橙色）要么非常长，要么终点位于局部最小值。但是，算法必须对成千上万个参数进行优化，显然起点的选择不可能每次都碰巧正确。在具体实践中，这种方法用处不大。因为所选择的起点可能会导致路径（即训练时间）较长，或者目标点并不位于全局最小值，导致网络的精度下降。

因此，为避免上述问题，过去几年已开发出大量可作为替代的优化算法。一些替代的方法包括随机梯度下降法、动量法、AdaGrad方法、RMSProp方法、Adam方法等。鉴于每种算法都有其特定的优缺点，实践中具体使用的算法将由网络开发人员决定。

训练数据

在训练过程中，我们会向网络提供标有正确对象类的图像，如汽车、轮船等。本例使用了已有的CIFAR-10数据集。当然，在具体实践中，人工智能可能会用于识别猫、狗和汽车之外的领域。这可能需要开发新应用，例如检测制造过程中螺钉的质量必须使用能够区分好坏螺钉的训练数据对网络进行训练。创建此类数据集极其耗时费力，往往是开发人工智能应用过程中成本最高的一步。编译完成的数据集分为训练数据集和测试数据集。训练数据集用于训练，而测试数据则用于在开发过程的最后检查训练好的网络的功能。

结论

本系列文章的第一部分《人工智能简介：什么是机器学习？——第一部分》介绍了神经网络并对其设计和功能进行了详细探讨。本文则定义了函数所需的所有权重和偏置，因此现在可以假定网络能够正常运行。在后续第三部分的文章中，我们将通过硬件运行神经网络以测试其识别猫的能力。这里我们将使用ADI公司开发的带硬件CNN加速器的MAX78000人工智能微控制器来进行演示。

更多精彩内容欢迎点击==>>电子技术应用-AET<<

标签：

训练卷积神经网络：什么是机器学习？——第二部分|天天即时

训练卷积神经网络：什么是机器学习？——第二部分|天天即时

4月18日基金净值：招商瑞泰1年持有混合A最新净值1.0166，涨0.01%

绑架冰激凌_关于绑架冰激凌介绍-环球时快讯

新疆生产建设兵团原副司令员，党委原常委、政法委原书记杨福林受贿案一审宣判 当前焦点

山东墨龙：公司严格遵守《深圳证券交易所股票上市规则》等相关法律法规，及时履行信息披露义务

【全球报资讯】制动液故障灯图标_制动液不足图标

航天员叶光富回成都母校！寄语学子：心中有梦，勇于追梦，勤于圆梦-观热点

天天讯息：每体：奥巴梅扬希望下赛季回归巴萨，并愿意为此降薪

【世界速看料】新华联：拟以公司不能清偿到期债务且明显缺乏清偿能力为由，向法院申请重整及预重整

当前最新：steam为啥运行不了_steam运行不了出一堆英文

肩周炎用什么膏药最好国产的_肩周炎用什么膏药最好

i5系列处理器排名价格 i5系列处理器排名

经济法的内容指的是什么 经济法的主要内容是什么|焦点热议

山东开展药品经营和使用专项检查 天天热推荐

一季度中国保险消费者信心指数明显提升-天天精选

不要对着“假问题”，去找“真答案”

人民银行上海总部、上海市工商联联合举办民营企业银企对接暨集中授信签约活动

解剖屎山，寻觅黄金之第二弹-天天热资讯

拥抱注册制：机遇与挑战首届河北资本市场高质量发展大会成功举办

知识经济发展理论

大道携手央视财经《最美自驾路》栏目，共同打造皮卡新生活 环球快资讯

杭州女童坠亡案将择期宣判

前沿资讯!创历史！CBA季后赛1/4决赛对阵图：浙江1-0领先 深圳直接晋级

全球连线 | 中企承建的伊拉克示范学校项目助力当地教育发展 新要闻

资讯：大拐点！央妈 收紧流动性

天天动态:Patsnap将推出其最新的人工智能GPT产品“PatsnapGPT”

宝宝皮肤干燥症是什么病_宝宝皮肤干燥症怎么办

当前头条：重回乱世纵横沙场《三国：归途》Steam正式发售

全球今日讯！国网石泉公司：用“心”服务进社区

环球短讯！音乐编辑_关于音乐编辑的介绍

成品油价格持续飙升 近20家新能源车企上调售价

广西百色宣布解除“不进不出”管控措施

2月15日零时起 苏州市关闭15个高速公路入口

“95后”羌族货运员的春运：为中欧班列尽一份力

养牛场里的“春节时光”

广西靖西市两地调整为中风险地区

苏州市多地调整为中风险地区

云南2月14日新增无症状感染者6例

实体书店为什么接二连三遭遇危机？生存之道在哪

卜卦、占星、看手相…… 为什么有的年轻人总想算一卦

一言不合放火烧家 任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震 震源深度7千米

应急管理部：1月全国接报生产安全事故死亡超1100人

江苏省省长：苏州市要把疫情防控作为头等大事、第一要务

广西新增确诊病例降至1例 百色市有序解除管控

新疆生产建设兵团原副司令员，党委原常委、政法委原书记杨福林受贿案一审宣判当前焦点

经济法的内容指的是什么经济法的主要内容是什么|焦点热议

山东开展药品经营和使用专项检查天天热推荐

大道携手央视财经《最美自驾路》栏目，共同打造皮卡新生活环球快资讯

前沿资讯!创历史！CBA季后赛1/4决赛对阵图：浙江1-0领先深圳直接晋级

全球连线 | 中企承建的伊拉克示范学校项目助力当地教育发展新要闻

资讯：大拐点！央妈收紧流动性

成品油价格持续飙升近20家新能源车企上调售价

2月15日零时起苏州市关闭15个高速公路入口

一言不合放火烧家任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震震源深度7千米

广西新增确诊病例降至1例百色市有序解除管控