深度 | BatchNorm是如何在深度学习优化过程中发挥作用的?(4)


文中从理论上论证了增加BatchNorm可以降低参数的灵敏度,并很好的改善优化问题的解空间。 [好文分享:www.11jj.com]


[本文来自:www.11jj.com]

深度 | BatchNorm是如何在深度学习优化过程中发挥作用的?(4)

不同norm下VGG网络的激活直方图


那么BatchNorm是平滑解空间最好且唯一的方法吗?答案当然不是,作者研究了一些基于自然数据统计的正则化策略,类似BatchNorm修正激活函数一阶矩的方案,用p范数均值进行正则化。不同的是,对于这些正则化方案,层输入的分布不再是高斯(见上图)。因此,用这种p范数进行正则化并不能保证对分布矩和分布稳定性有任何控制。实验结果如下图所示,可以观察到所有的正则化方法都提供了与BatchNorm相媲美的性能。事实上,对于深度线性网络来说,"L1正则化表现的要比BatchNorm更好。


值得注意的是,p范数正则化方法会导致更大的分布covariate shift。但所有这些技术都提高了解空间的平滑度,这点与BatchNorm的效果相似。以上表明BatchNorm对训练的积极影响可能实属偶然。因此,对类似的正则化方案的设计进行深入探索十分有必要,可以为网络训练更好的性能。

深度 | BatchNorm是如何在深度学习优化过程中发挥作用的?(4)

 

综上所述,作者研究了BatchNorm能提高深度神经网络训练有效性的根源,并发现BatchNorm与internal covariate shift之间的关系是微不足道的。特别是,从优化的角度来看,BatchNorm并不会减少internal covariate shift。相反,BatchNorm对训练过程的关键作用在于其重新规划了优化问题,使其Lipschitzness稳定和β-smoothness更有效,这意味着训练中使用的梯度更具有良好的预测性和性能,从而可以更快速、有效地进行优化。


自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    绣球花养护注意事项(绣球养花技巧)

    大家好,小乐今天来为大家解答绣球花养护注意事项以下问题,绣球养花技巧很多人还不知道,现在让我们一起来看看吧!1、绣球花喜湿但是怕涝,

  2. 2

    苏教版数学四年级下册教学设计《运用乘法分配律进行简便计算》(含反思)

    第六单元 运算律课题:运用乘法分派律进行轻便较量 第 3 课时 总第 课时教授方针:1.让学生在解决实际问题的过程中发现并懂得乘法分派律,学

  3. 3

    梦的翅膀受了伤简谱(梦的翅膀受了伤翻唱特别好听)

    大家好,小娟今天来为大家解答梦的翅膀受了伤简谱以下问题,梦的翅膀受了伤翻唱特别好听很多人还不知道,现在让我们一起来看看吧!1、《梦的

  4. 4

    妈妈的朋友中文字幕(单身妈妈韩剧电视剧免费观看)

    大家好,小美今天来为大家解答妈妈的朋友中文字幕以下问题,单身妈妈韩剧电视剧免费观看很多人还不知道,现在让我们一起来看看吧!1、请直接

  5. 5

    立案处理!

    合作/推广:sdjf0757(微旌旗)美容美发是好多人都邑选择的消费但个体不良商家对准消费者的爱美之心使用过时产物、诱导消费、子虚宣传精心设置

  6. 6

    【爱莲说】征稿!一等奖5000元!

    首届“奇秀不减雁荡·东坡杯”五莲山水文学大赛征稿启事为深入贯彻习近平新时代中国特色社会主义思惟和党的二十大精神,果断文化自信,深条理

  7. 7

    “宝鸡医生在北京救人”的视频传到非洲刚果金、埃及了

    点击上方蓝字免费订阅!!慢城太白传媒,您生活中的贴心伴侣!  昨晚宝鸡融媒发布了一条视频↓↓↓北京西站男子晕厥宝鸡大夫紧要急救引得大

  8. 8

    团团分享 | 龙江是我家·越玩越有Young

    往期出色谋划 / 共青团黑龙江职业学院委员会运营 / 校大学生新媒体运营中心总监 / 石 倩 监制 / 梁 立 唐晓恬总编 / 马雨薇审核 / 马 莉 魏刘欣

Copyright 2024.依依自媒体,让大家了解更多图文资讯!