推翻剪枝固有观点?清华、伯克利提出NN过参数化真的不重要(4)

4.2 自动发现的目标架构 [原文来自:www.11jj.com]

推翻剪枝固有观点?清华、伯克利提出NN过参数化真的不重要(4) [好文分享:www.11jj.com]

表 4:Network Slimming (Liu et al., 2017) 的(准确率)结果。「Prune Ratio」表示整个网络中被剪掉的通道的比例。每个模型的 Prune Ratio 都和原论文一致。

4.3 向目标检测任务的迁移学习

推翻剪枝固有观点?清华、伯克利提出NN过参数化真的不重要(4)

表 7:剪枝在检测任务上的(mAP)结果。剪枝后的模型来自于 Li et al. (2017)。Prune-C 指在分类预训练权重上剪枝,Prune-D 指在迁移至检测任务之后的权重上进行剪枝。Scratch-E/B 表示从头开始在分类任务上预训练剪枝后的模型,然后迁移至检测任务。

5 用网络剪枝进行架构搜索

推翻剪枝固有观点?清华、伯克利提出NN过参数化真的不重要(4)

图 3:不同方法的剪枝后架构,所有模型都是从头训练的,平均运行 5 次。自动剪枝方法(左:Network Slimming (Liu et al., 2017),右:非结构化剪枝 (Han et al., 2015))获得的架构比在整个网络中均匀修剪通道或稀疏权重的方法具备更高的参数效率。

剪枝后架构的设计原则

如果自动发现的架构参数效率更高,研究者可能会想:可以从中得出如何设计更好架构的普遍原则吗?为解答该问题,我们分别对 Network Slimming 和非结构化剪枝进行了两次实验,使用的数据集分别是 VGG-19 和 CIFAR-100。

对于 Network Slimming,我们使用剪枝后架构每个层阶段(具备相同特征图大小的层)的平均通道数来构建新的架构集合,我们将该方法称为「Guided Pruning」;对于非结构化剪枝,我们分析了剪枝后架构的稀疏度模式(图 4),并用它们构建新的稀疏模型集合,我们将该方法称为「Guided Sparsifying」,结果见图 5。可以看到对于 Network Slimming(左)和非结构化剪枝(右),指导设计出的架构(绿色)性能与剪枝后架构(蓝色)不相上下。

推翻剪枝固有观点?清华、伯克利提出NN过参数化真的不重要(4)

图 4:VGG-16 的非结构化剪枝模型中特定层阶段的 3×3 卷积核的平均稀疏度模式。颜色越深表示权重被保留的概率越高。

自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    本周天气上新!有风有雨有浮尘~

    新的一周又起头啦本周仍会有大风、浮尘、降水天色将对平常生活和农业生产造成影响请做好防护具体若何?一路来看↓↓↓将来一周天色估计:1

  2. 2

    这些古诗句富有哲理,写议论文真好用,快摘抄!

    这部门内容节选自寨主作文资料,迎接在文末订购全套资料!1.已识乾坤大,犹怜草木青。(马一浮)适用主题:软和硬寨主示范:哪怕是猛火焚烧、

  3. 3

    雷雨+冰雹+大风返场!广东将有强对流天气,南雄将迎来中雨、局部大雨

    热҉热҉热҉热҉热҉这几天广东气温狂飙多地打破30℃想必这初夏的“魅力”人人都已感触到了短袖、短裤、空调是要成为广东人比来的标配了?注重!

  4. 4

    痛别!著名演员去世!曾带来无数笑声

    起原:北京戏曲曲艺圈、北京曲艺大观园、北京电视台文艺频道、央广网、新京报、新浪微博等4月14日,北京曲艺团有名相声表演艺术家陈涌泉家人

  5. 5

    以色列:将对伊朗做出前所未有的反应

    本地时间14日,一名以色列高级官员透露,他承诺将对伊朗的袭击做出“空前未有的回响”,并催促以色列人不要睡眠,以目睹德黑兰即将发生的事情

  6. 6

    【创建全国文明城市】公益广告:“课本封面”文明礼仪

    起原:文明一号快长按二维码 存眷松原发布中共松原市委宣传部 主办

  7. 7

    周凯(周楷恒身高)

    大家好,小丽今天来为大家解答周凯以下问题,周楷恒身高很多人还不知道,现在让我们一起来看看吧!1、周凯运动生涯介绍 1、2017年1月参加国家队

  8. 8

    虐心句子(虐心句子)

    大家好,小豪今天来为大家解答虐心句子以下问题,虐心句子很多人还不知道,现在让我们一起来看看吧!1、1,忘川之水,在于忘情。2、展开全部

Copyright 2024.依依自媒体,让大家了解更多图文资讯!