业界 | 弱监督学习下的商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介(3)

业界 | 弱监督学习下的商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介(3)

[好文分享:www.11jj.com]

在服装第二名的解决方案中,作者采用了如下网络架构。首先开发者会采用非常多的数据增强方法增加输入图像,例如水平翻转、旋转、高斯模糊、锐化、截取和归一化等方法。然后根据 DenseNet、inception_resnet_v2、Inception-v3、Nasnet 和 ResNet-50 等九个基础卷积网络抽取输入图像的特征,并分别作出预测。最后结合所有基础模型的预测就能得出非常不错的最终结果。

[转载出处:www.11jj.com]

如前所述细粒度识别需要很多局部图像信息才能实现子类别的判断,谷歌(需要确切身份)Xiao Zhang 表示:「选手这些网络最终层的 dimension 都比较小(比如 7x7),这种情况下最终做决策时很难兼顾不同尺度的信息。如果需要兼顾局部和整体需要使用 Feature Pyramid Network,或者类似于编码器/解码器的结构在最终层使用高维的预测。」

业界 | 弱监督学习下的商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介(3)

在整个流程中,Stacking CNN 是非常有意思的过程。开发者会将九个模型的预测结果叠加在一起为 9×228×1 的张量,其中每一个基础模型提供一张 1×228×1 的张量,它代表了模型对 228 个类别的预测结果。如下所示当叠加为这种张量后,我们可以使用 3×1 的卷积在它上面执行步幅为 1 的卷积运算,这种卷积可以学习到各基础模型原始预测之间的相关性。

业界 | 弱监督学习下的商品识别:CVPR 2018细粒度识别挑战赛获胜方案简介(3)

上图输出张量 7×228×8(8 个 3×1 的卷积核),在经过 16 个 3×1 的卷积核执行卷积运算并馈送到全连接层后,就能做出最终的预测。因为 3×1 的卷积其实相当于在同一个类别上,加权三个模型的预测并输出到下一层。所以这也相当于一种集成方法,模型会自动学习不同基础模型预测的重要性,并结合所有基础模型作出最终预测。

家具细粒度分类的两个解决方案也非常有特点,例如 Roman Khomenko 和 Lei Li 设计的家具第一名解决方案使用了一种称之为概率校准的技术。他们表示在训练集中,类别数量是非常不平衡的,但在验证集中类别数量是平衡的,因此我们可能需要使用概率校准以解决这种训练于验证之间的分布差异。


自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    揭阳爱维艾夫医院临床医生(4.29-5.5)出诊信息

    有疑问,点击“阅读原文”咨询!喜欢我,你就点个“在看”吧!

  2. 2

    肿瘤患者不能吃“发物”?医生:真正需要忌口的是这些!

    点亮星标,不错过每一次推送本文作者:冯艳,山东省烟台毓璜顶病院临床营养科副主任医师在临床中,我经常会被肿瘤患者扣问关于“忌口”和“

  3. 3

    氯雷他定冲上热搜!医生提醒

    山西青年你想看的都在这里近日,全国各地的飞絮期光降跟着杨柳絮纷飞打喷嚏、鼻塞、鼻子痒又起头“骚扰”过敏性鼻炎患者的生活为了缓解症状

  4. 4

    larva动画(larva动画合集)

    大家好,小伟今天来为大家解答larva动画以下问题,larva动画合集很多人还不知道,现在让我们一起来看看吧!1、《爆笑虫子》。2、《爆笑虫子》(

  5. 5

    牛股推荐股票交流群(牛股推荐股票交流群)

    大家好,小娟今天来为大家解答牛股推荐股票交流群以下问题,牛股推荐股票交流群很多人还不知道,现在让我们一起来看看吧!1、179533491,大陆股

  6. 6

    营销培训课程(营销培训课程小吃营销)

    大家好,小娟今天来为大家解答营销培训课程以下问题,营销培训课程小吃营销很多人还不知道,现在让我们一起来看看吧!1、品牌管理课程:品牌

  7. 7

    中国人民银行征信中心(中国人民银行征信中心官网查询入口)

    大家好,小美今天来为大家解答中国人民银行征信中心以下问题,中国人民银行征信中心官网查询入口很多人还不知道,现在让我们一起来看看吧!

  8. 8

    死猪图片表情包(死猪图片大全猪瘟)

    大家好,小美今天来为大家解答死猪图片表情包以下问题,死猪图片大全猪瘟很多人还不知道,现在让我们一起来看看吧!1、这个梗出自于动画《猪

Copyright 2024.依依自媒体,让大家了解更多图文资讯!