S\left( {i,j} \right) = \left( {I * K} \right)\left( {i,j} \right) = \sum\limits_m^{} {\sum\limits_n^{} {I\left( {i - m,j - n} \right) \cdot K\left( {m,n} \right)} } S ( i , j ) = ( I K ) ( i , j ) = m n I ( i m , j n ) K ( m , n )

卷积运算中的卷积核需要进行上下翻转和左右翻转:

S\left( {i,j} \right) = \begin{bmatrix} \begin{matrix} {I\left( {i - 2,j - 2} \right)} & {I\left( {i - 2,j - 1} \right)} & {I\left( {i - 2,j} \right)}\\{I\left( {i - 1,j - 2} \right)} & {I\left( {i - 1,j - 1} \right)} & {I\left( {i - 1,j} \right)}\\{I\left( {i,j - 2} \right)} & {I\left( {i,j - 1} \right)} & {I\left( {i,j} \right)}\\\end{matrix} \end{bmatrix}.*\begin{bmatrix} \begin{matrix} {K\left( {2,2} \right)} & {K\left( {2,1} \right)} & {K\left( {2,0} \right)}\\{K\left( {1,2} \right)} & {K\left( {1,1} \right)} & {K\left( {1,0} \right)}\\{K\left( {0,2} \right)} & {K\left( {0,1} \right)} & {K\left( {0,0} \right)}\\\end{matrix} \end{bmatrix}
S ( i , j ) = I ( i 2 , j 2 ) I ( i 1 , j 2 ) I ( i , j 2 ) I ( i 2 , j 1 ) I ( i 1 , j 1 ) I ( i , j 1 ) I ( i 2 , j ) I ( i 1 , j ) I ( i , j ) . K ( 2 , 2 ) K ( 1 , 2 ) K ( 0 , 2 ) K ( 2 , 1 ) K ( 1 , 1 ) K ( 0 , 1 ) K ( 2 , 0 ) K ( 1 , 0 ) K ( 0 , 0 )

如果忽略卷积核的左右翻转,对于实数卷积实际上与互相换运算是一致的:

▲ 图1.1.1 二维卷积 运算示意图

2、卷积步长

卷积步长,也就是每次卷积核移动的步长。

下图显示了卷积步长分别为1,2两种情况下的输出结果。从中可以看到,当步长大于1之后,相当于从原来的的步长为1的情况下结果进行降采样。

▲ 图1.1.2 卷积步长分别为1,2两种情况下输出的结果

3、卷积模式

根据结果是否要求卷积核与原始图像完全重合,部分重合以及结果尺寸的要求,卷积模式包括有三种:

  • Full :允许卷积核部分与原始图像重合;所获得结果的尺寸等于原始图像尺寸加上卷积核的尺寸减1;
  • Same :允许卷积核部分与原始图像重合;但最终截取Full卷积结果中中心部分与原始图像尺寸相同的结果;
  • Validate :所有卷积核与原始图像完全重合下的卷积结果;结果的尺寸等于原始图像的尺寸减去卷积核尺寸加1;

下面显示了三种卷积模式对应的情况。实际上可以通过对于原始图像补零(Padding)然后通过Validate模式获得前面的Full,Same两种模式的卷积结果。

▲ 图1.1.3 三种卷积模式示意图

4、数据填充

(1)边缘填充

数据填充,也称为Padding。如果有一个尺寸为

5、感受野

感受野:卷积神经网络每一层输出的特征图(featuremap)上的像素点在输 入图片上映射的区域大小,即特征图上的一个点对应输入图上的区 域。

下图反映了经过几层卷积之后,卷积结果所对应前几层的图像数据范围。

▲ 图1.1.7 经过几层卷积之后,卷积结果所对应前几层的图像数据范围

计算感受野的大小,可以从后往前逐层计算:

( k 1 ) / 2 就不是整数了。

(2)更容易找到卷积锚点

在CNN中,进行卷积操作时一般会以卷积核模块的一个位置为基准进行滑动,这个基准通常就是卷积核模块的中心。若卷积核为奇数,卷积锚点很好找,自然就是卷积模块中心,但如果卷积核是偶数,这时候就没有办法确定了,让谁是锚点似乎都不怎么好。

▲ , LeNET CNN的结构示意图

二、激活函数

激活函数是用来加入非线性因素,提高网络表达能力,卷积神经网络中最常用的是ReLU,Sigmoid使用较少。

▲ 图1.2.1 常见到的激活函数
  • 计算速度快,ReLU函数只有线性关系,比Sigmoid和Tanh要快很多
  • 输入为正数的时候,不存在梯度消失问题

ReLU函数的缺点:

  • 强制性把负值置为0,可能丢掉一些特征
  • 当输入为负数时,权重无法更新,导致“神经元死亡”(学习率不 要太大)

2、Parametric ReLU

  • 计算量较大,收敛速度较慢

CNN在卷积层尽量不要使用Sigmoid和Tanh,将导致梯度消失。首先选用ReLU,使用较小的学习率,以免造成神经元死亡的情况。

如果ReLU失效,考虑使用Leaky ReLU、PReLU、ELU或者Maxout,此时一般情况都可以解决

4、特征图

  • 浅层卷积层 :提取的是图像基本特征,如边缘、方向和纹理等特征
  • 深层卷积层 :提取的是图像高阶特征,出现了高层语义模式,如“车轮”、“人脸”等特征

三、池化层

池化操作使用某位置相邻输出的总体统计特征作为该位置 的输出,常用最大池化 (max-pooling)和均值池化(average- pooling)

池化层不包含需要训练学习的参数,仅需指定池化操作的核大小、操作步幅以及池化类型。

▲ 图1.3.1 最大值池化一是均值池化示意图

池化的作用:

  • 减少网络中的参数计算量,从而遏制过拟合;
  • 增强网络对输入图像中的小变形、扭曲、平移的鲁棒性(输入里的微 小扭曲不会改变池化输出——因为我们在局部邻域已经取了最大值/ 平均值)
  • 帮助我们获得不因尺寸而改变的等效图片表征。这非常有用,因为 这样我们就可以探测到图片里的物体,不管它在哪个位置

四、全连接与输出层

  • 对卷积层和池化层输出的特征图(二维)进行降维
  • 将学到的特征表示映射到样本标记空间的作用
  • 对于分类问题采用Softmax函数:
  • 对于回归问题,使用线性函数:

五、CNN的训练

1、网络训练基本步骤

CNN的训练,也称神经网络的学习算法与经典BP网络是一样的,都属于随机梯度下降(SGD:Stochastic Gradient Descent),也称增量梯度下降,实验中用于优化可微分目标函数的迭代算法。

  • Step 1 :用随机数初始化所有的卷积核和参数/权重

  • Step 2 :将训练图片作为输入,执行前向步骤(卷积, ReLU,池化以及全连接层的前向传播)并计算每个类别的对应输出概率。

  • Step 3 :计算输出层的总误差

  • Step 4 :反向传播算法计算误差相对于所有权重的梯度,并用梯度下降法更新所有的卷积核和参数/权重的值,以使输出误差最小化

注:卷积核个数、卷积核尺寸、网络架构这些参数,是在 Step 1 之前就已经固定的,且不会在训练过程中改变——只有卷 积核矩阵和神经元权重会更新。

2、网络等效为BP网络

和多层神经网络一样,卷积神经网络中的参数训练也是使用误差反向传播算法,关于池化层的训练,需要再提一下,是将池化层改为多层神经网络的形式:

▲ 图1.5.1 神经网络中池化层对应着多层神经网络

一、LeNet-5

LeNet-5由LeCun等人提出于1998年提出,主要进行手写数字识别和英文字母识别。经典的卷积神经网络,LeNet虽小,各模块齐全,是学习 CNN的基础。

参考 http://yann.lecun.com/exdb/lenet/

Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE, November 1998.

2、网络结构

▲ 图2.1.1 LeNet-5网络结构
  • 输入层 :32 × 32 的图片,也就是相当于1024个神经元;

  • C1层(卷积层) :选择6个 5 × 5 的卷积核,得到6个大小为32-5+1=28的特征图,也就是神经元的个数为 6 × 28 × 28 = 4704;

  • S2层(下采样层) :每个下抽样节点的4个输入节点求和后取平均(平均池化),均值 乘上一个权重参数加上一个偏置参数作为激活函数的输入,激活函数的输出即是下一层节点的值。池化核大小选择 2 ∗ 2 得到6个 14 ×14大小特征图

  • C3层(卷积层) :用 5 × 5 的卷积核对S2层输出的特征图进行卷积后,得到6张10 × 10新 图片,然后将这6张图片相加在一起,然后加一个偏置项b,然后用 激活函数进行映射,就可以得到1张 10 × 10 的特征图。我们希望得到 16 张 10 × 10 的 特 征 图 , 因 此 我 们 就 需 要 参 数 个 数 为 16 × ( 6 × ( 5 × 5 ) ) 个参数

  • S4层(下采样层) :对C3的16张 10 × 10 特征图进行最大池化,池化核大小为2 × 2,得到16张大小为 5 × 5的特征图。神经元个数已经减少为:16 × 5 × 5 =400

  • C5层(卷积层) :用 5 × 5 的卷积核进行卷积,然后我们希望得到120个特征图,特征图 大小为5-5+1=1。神经元个数为120(这里实际上是全连接,但是原文还是称之为了卷积层)

  • F6层(全连接层) :有84个节点,该层的训练参数和连接数都( 120 + 1 ) × 84 = 10164

  • Output层 :共有10个节点,分别代表数字0到9,如果节点i的输出值为0,则网络识别的结果是数字i。采用的是径向基函数(RBF)的网络连接方式:

y i = j ( x j w i j ) 2

  • 总结 :卷积核大小、卷积核个数(特征图需要多少个)、池化核大小(采样率多少)这些参数都是变化的,这就是所谓的CNN调参,需要学会根据需要进行不同的选择。

AlexNet由Hinton的学生Alex Krizhevsky于2012年提出,获得ImageNet LSVRC-2012(物体识别挑战赛)的冠军,1000个类别120万幅高清图像(Error: 26.2%(2011) →15.3%(2012)),通过AlexNet确定了CNN在计算机视觉领域的王者地位。

参考 :A. Krizhevsky, I. Sutskever, and G. Hinton. Imagenet classification with deep convolutional neural networks. In NIPS, 2012.

  • 首次成功应用ReLU作为CNN的激活函数
  • 使用Dropout丢弃部分神元,避免了过拟合
  • 使用重叠MaxPooling(让池化层的步长小于池化核的大小), 一定程度上提升了特征的丰富性
  • 使用CUDA加速训练过程
  • 进行数据增强,原始图像大小为256×256的原始图像中重 复截取224×224大小的区域,大幅增加了数据量,大大减 轻了过拟合,提升了模型的泛化能力

2、网络结构

AlexNet可分为8层(池化层未单独算作一层),包括5个卷 积层以及3个全连接层:

▲ 图2.2.1 AlexNet网络结构
  • 输入层 :AlexNet首先使用大小为224×224×3图像作为输入(后改为227×227×3) (227-11+2*0)/4+1=55

  • 第一层(卷积层) :包含96个大小为11×11的卷积核,卷积步长为4,因此第一层输出大小为55×55×96;然后构建一个核大小为3×3、步长为2的最大池化层进行数据降采样,进而输出大小为27×27×96

  • 第二层(卷积层) :包含256个大小为5×5卷积核,卷积步长为1,同时利用padding保证 输出尺寸不变,因此该层输出大小为27×27×256;然后再次通过 核大小为3×3、步长为2的最大池化层进行数据降采样,进而输出大小为13×13×256

  • 第三层与第四层(卷积层) :均为卷积核大小为3×3、步长为1的same卷积,共包含384个卷积核,因此两层的输出大小为13×13×384

  • 第五层(卷积层) :同样为卷积核大小为3×3、步长为1的same卷积,但包含256个卷积 核,进而输出大小为13×13×256;在数据进入全连接层之前再次 通过一个核大小为3×3、步长为2的最大池化层进行数据降采样, 数据大小降为6×6×256,并将数据扁平化处理展开为9216个单元

  • 第六层、第七层和第八层(全连接层) :全连接加上Softmax分类器输出1000类的分类结果,有将近6千万个参数

三、VGGNet

VGGNet由牛津大学和DeepMind公司提出:

  • Visual Geometry Group :https://www.robots.ox.ac.uk/~vgg/
  • DeepMind :https://deepmind.com/

参考 :K. Simonyan and A. Zisserman. Very deep convolutional networks for large-scale image recognition. In ICLR, 2015.

比较常用的是VGG-16,结构规整,具有很强的拓展性。相较于AlexNet,VGG-16网络模型中的卷积层均使用 3 ∗ 3 3 33∗3 的 卷积核,且均为步长为1的same卷积,池化层均使用 2 ∗ 2 2 22∗2 的 池化核,步长为2。

2、网络结构

▲ 图2.3.1 VGGNet网络结构
  • 两个卷积核大小为 3 ∗ 3 3 33∗3 的卷积层串联后的感受野尺寸为 5 ∗ 5 5 55∗5, 相当于单个卷积核大小为 5 ∗ 5 5*55∗5 的卷积层
  • 两者参数数量比值为( 2 ∗ 3 ∗ 3 ) / ( 5 ∗ 5 ) = 72 % (2 3 3)/(5*5)=72%(2∗3∗3)/(5∗5)=72% ,前者参数量更少
  • 此外,两个的卷积层串联可使用两次ReLU激活函数,而一个卷积层只使用一次

四、Inception Net

Inception Net 是Google公司2014年提出,获得ImageNet LSVRC-2014冠军。文章提出获得高质量模型最保险的做法就是增加模型的深度(层数)或者是其宽度(层核或者神经元数),采用了22层网络。

Inception四个版本所对应的论文及ILSVRC中的Top-5错误率:

  • Going Deeper with Convolutions: 6.67%

  • Batch Normalization: Accelerating Deep Network Training by

  • Reducing Internal Covariate Shift: 4.8%

  • RethinkingtheInceptionArchitectureforComputerVision:3.5%

  • Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning: 3.08%

2、网络结构

Inception Module

  • 深度 :层数更深,采用了22层,在不同深度处增加了两个 loss来避免上述提到的梯度消失问题
  • 宽度 :Inception Module包含4个分支,在卷积核3x3、5x5 之前、max pooling之后分别加上了1x1的卷积核,起到了降低特征图厚度的作用
    • 1×1的卷积的作用:可以跨通道组织信息,来提高网络的表达能力;可以对输出通道进行升维和降维。
▲ 图2.4.1 Inception Net网络结构

五、ResNet

ResNet(Residual Neural Network),又叫做残差神经网 络,是由微软研究院的何凯明等人2015年提出,获得ImageNet ILSVRC 2015比赛冠军,获得CVPR2016最佳论文奖。

随着卷积网络层数的增加,误差的逆传播过程中存在的梯 度消失和梯度爆炸问题同样也会导致模型的训练难以进行,甚至会出现随着网络深度的加深,模型在训练集上的训练误差会出现先降低再升高的现象。残差网络的引入则有助于解决梯度消失和梯度爆炸问题。

残差块

ResNet的核心是叫做残差块(Residual block)的小单元, 残差块可以视作在标准神经网络基础上加入了跳跃连接(Skip connection)。

▲ 图2.5.1 原链接结构示意图
  • 跳跃连接:
▲ 图2.5.2 跳跃结构示意图
  • Skip connection作用:

六、Densenet

DenseNet中,两个层之间都有直接的连接,因此该网络的直接连接个数为L(L+1)/2。

对于每一层,使用前面所有层的特征映射作为输入,并且使用其自身的特征映射作为所有后续层的输入:

▲ 图2.6.1 DenseNet示意图

参考 :Huang, G., Liu, Z., Van Der Maaten, L., & Weinberger, K. Q. (2017). Densely connected convolutional networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4700- 4708).

2、网络结构

5层的稠密块示意图:

▲ 图2.6.2 5层DenseNet的结构

DenseNets可以自然地扩展到数百个层,而没有表现出优化困难。在实验中,DenseNets随着参数数量的增加,在精度上产生一致的提高,而没有任何性能下降或过拟合的迹象。

  • 缓解了消失梯度问题
  • 加强了特征传播,鼓励特征重用
  • 一定程度上减少了参数的数量
结 ※

love1005lin 在CSDN上2021-11-19发布的一篇深度学习的卷积神经网,内容整理的精简,移动,现在将其进行转载,并发布在公众号“ TSINGHUAZHUOQING ”中。

深度学习-卷积神经网络(CNN) : https://blog.csdn.net/love1005lin/article/details/121418206?utm_source=app&app_version=4.20.0

■ 相关文献链接:

● 相关图表链接:

原文链接: https://blog.csdn.net/love1005lin/article/details/121418206?utm_source=app&app_version=4.20.0 本文通过图文结合的方式,详细 介绍 结构 、驱动及技术指标各项内容。    一、常用运动学构形    1、笛卡尔操作臂    优点:很容易通过计算机控制实现,容易达到高精度。缺点:妨碍工作, 且占地面积大, 运动速度低, 密封性不好。    ①焊接、搬运、上下料、包装、码垛、拆垛、检测、探伤、分类、装配、贴标、喷码、打码、(软仿型)喷涂、目标跟随、排爆等一系列工作。    ②特别适用于多品种,便批量的柔性化作业,对于稳定,提高产品质量,提高劳动生产率,改善劳动条件和产品的快速更新换代有着十分重要的作用。    2、铰链型操作臂(关节型)    关节机器人的关节全都是旋转的, 类似于人的手臂,工业机 文章目录人类视觉原理从 神经网络 到卷积 神经网络 CNN )数据输入层卷积计算层卷积的计算参数共享机制激励层池化层全连接层 CNN 优缺点卷积 神经网络 的常用框架 人类视觉原理 深度学习 的许多研究成果,离不开对大脑认知原理的研究,尤其是视觉原理的研究。 1981 年的诺贝尔医学奖,颁发给了 David Hubel(出生于加拿大的美国神经生物学家) 和TorstenWiesel,以及 Roger Sperry。... 弹簧操作机构的 基本 动作原理合闸弹簧和跳闸弹簧是独立的,储能机构一般只给合闸弹簧储能,而跳闸弹簧一般是靠断路器合闸动作储能。在合闸回路中串联有开关储能接点,也就是说开关未储能就不能进行合闸。但分闸回路中没有串联有开关未储能接点。所以就算开关未储能,也可以跳开。(注意:这里的开关未储能指的是合闸弹簧未储能,而分闸弹簧未储能是没有接点出来的)。  在断路器断开时,分闸弹簧是还没储能的,而合闸弹簧已储能。合闸时,合闸弹簧释放能量,合闸同时给分闸弹簧储能。以确保开关在合上的时候能跳开。合闸弹簧释放完能量时(开关刚合上),电机开始给合闸弹簧储能,这个大概需要十秒钟,此时就算合于故障,因为分闸弹簧已储能,所 作为一名电源研发工程师,自然经常与各种芯片打交道,可能有的工程师对芯片的内部并不是很了解,不少同学在应用新的芯片时直接翻到 Datasheet 的应用页面,按照推荐设计搭建外围完事。如此一来即使应用没有问题,却也忽略了更多的技术细节,对于自身的技术成长并没有积累到更好的经验。今天以一颗 DC/DC 降压电源芯片 LM2675 为例,尽量详细讲解下一颗芯片的内部设计原理和 结构 ,IC 行业的同学随便看看就好,欢迎指教!  LM2675-5.0 的典型应用电路   这个图包含了电源芯片的内部全部单元模块,BUCK 结构 我们已经很理解了,这个芯片的主要功能是实现对 MOS 管的驱动,并通过 FB 脚检 4.卷积层+池化层的组合可以在隐藏层中出现很多次。也可以灵活组合,卷积+卷积+池化、卷积+卷积等 5.在若干卷积层+池化层之后是全连接层(fully connected layer),其实就是DNN 结构 ,只是输出层使用了Softmax激活函数来做图像识别的分类 6.一般fc就为 CNN 的全连接层。全连接层一般.. CNN 通常包括这几层:输入层(Input layer)、卷积层(Convolutional layer)、池化层(pooling layer)以及输出层(全连接层+softmax layer)。 大家好,我是K同学啊! 你是否一直在关注不同的卷积 神经网络 ( CNN )?近年来,我们见证了无数 CNN 的诞生。这些网络已经变得如此之深,以至于很难将整个模型可视化。我们不再跟踪它们,而是将它们视为黑盒模型。 这篇文章是 10 种常见 CNN 架构的可视化。这些插图提供了整个模型的更紧凑的视图,而不必为了查看 softmax 层而向下滚动几次。除了这些图像,我还附上了一些关于它们如何随着时间“进化”的笔记——从 5 到 50 个卷积层,从普通卷积层到模块,从 2-3 个塔到 32 个塔,从 7⨉7 到 5 ⨉5— matlab画 CNN 网络图代码设计或可视化 神经网络 架构的工具 :Net2Vis从Keras代码自动为卷积 神经网络 生成抽象可视化。 :Visualkeras是一个Python软件包,可帮助可视化Keras(独立或包含在tensorflow中) 神经网络 体系 结构 。 它允许轻松的样式来满足大多数需求。 到目前为止,它支持分层样式体系 结构 生成,这对于 CNN (卷积 神经网络 )和抓取样式体系 结构 非常有用。 import visualkeras model visualkeras layered_view model display using system viewer visualkeras layered_view model to_file 'output.png' write visualkeras layered_view model to_file 'output.png' write visualkeras layered_vie 任何一个领域的深入发展,想有所收获,都需要熟悉其中更多的套路。电路系统的设计调试也不例外,大体包括几个大的部分:电源供电以及时序的控制;时钟是否工作;复位信号是否正确给出;再有就是一些外围的接口以及GPIO的控制等等。只有熟悉了这一个个的模块,才能让系统正常的转起来。   研究SDRAM也是一样,首先看看电源系统部分。 文章目录 CNN 结构 (1)输入层:输入数据(2)卷积层:通过卷积核进自动化特征提取,找到语义表征:卷积核:(3)激活层:增加非线性映射能力,否则,多层 CNN 只具有线性映射能力,与没有隐层是一样的效果Sigmoid函数Tanh函数Relu函数(4)池化层:通过下采样,减少计算量。(5)全连接层:重新拟合,减少特征信息的损失(6)输出层:输出运算结果 全连接 神经网络 中,相邻两层的每个神经元之间都是直接相连的。就是每一个节点都要参与下一层的计算, 随着神经元的个数,也即特征维数的增加,全连接 神经网络 的复杂度和计

二、AlexNet