亚博_腾讯优图提出半监督对抗单目深度估计,被人工智能顶级期刊TPAMI收录

来源:来自网络 作者:亚博科技前沿资讯网 时间: 2019-08-06 20:22:44

亚博报导:AppsFlyer发布《2019年上半年全球移动游戏商场数据陈述》,助力移动游戏工业全球化开展 1小时前
连云港市城建控股集团有限公司:19连城01:连云港市城建控股集团有限公司2019年非公开发行公司债券(第一期)在上海证券交易所挂牌 1小时前

作为国内计算机视觉人工智能范畴的领先者,腾讯优图试验室团队在单目深度估量上取得了新的研讨进展。

腾讯优图与厦门大学联合团队,一起提出了半监督对立单目深度估量,有望充沛运用海量的无标签数据所包括的信息,结合少数有标签数据以半监督的方式对网络进行练习。据悉,该研讨成果已被人工智能范畴最尖端的世界期刊TPAMI录入。

长期以来,根据深度卷积神经网络的分类、回归使命大多依靠很多的有标签数据来对网络进行练习。而在实践的算法布置中,往往只要海量的无标签数据以及十分少数的标签数据。怎么充沛运用这些少数的标签数据,使其到达和很多有标签数据下练习的模型附近的作用,对学术界和工业界来说一向都是一个难题。

bet36在线投注网据腾讯优图的研讨员介绍,该项研讨的中心难点在于,怎么从无标签数据中获取监督信息。传统办法一般需求同一场景的图画序列作为输入,经过构建立体几何联系来隐式地对深度进行重建。这种办法要求同一场景至少包括两张以上的图画,一般需求双目摄像头或视频序列才能够满意。腾讯优图与厦门大学联合团队,提出在一个对立练习的结构中,免除图画对判别器对真假样本有必要为同一图画的要求,“真样本对”选用有标签数据的RGB图画以及对应的实在深度图,“伪样本对”选用无标签RGB图画以及用生成器网络猜测出的深度图,由判别器网络区别猜测出的深度图与对应RGB直接是否契合实在的联合概率散布,从而从无标签数据中收成监督信息。与此同时,经过添加深度图判别器,来束缚猜测的深度图与实在深度图的散布一致性。该办法输入能够为恣意无相关图画,运用场景愈加广泛。而从试验成果也发现,当干流的深度估量网络作为一个生成器网络安插在半监督结构中时,都能够收成明显的作用提高。

QQ截图20190806105559.png

(图1:腾讯优图与厦门大学联合团队提出的半监督对立结构。图中的生成器网络接纳两个判别器网络的反应来更新自己的网络参数。)

在研讨的量化指标上,运用半监督对立结构,当有标签数据很少(500张)的情况下,仅运用250张无标签RGB图画就能够收成优于其他state-of-the-art办法的作用。当固定有标签数据量(500张),继续添加无标签RGB图画能够进一步对作用带来提高,终究当运用五万张无标签RGB图画后,该办法在各项指标上都远超当时的state-of-the-art办法。

QQ截图20190806105712.png

(表1:当有标签数据很少(500张)的情况下,仅运用250张无标签RGB图画就能够收成优于其他SOTA办法的作用。)

QQ截图20190806105552.png

(图2:当固定有标签数据量(500张),继续添加无标签RGB图画能够进一步对作用带来提高)

QQ截图20190806105546.png

(图3. 仅运用500张有标签数据练习的模型作用。从左到右依次为RGB图画、实在深度图和优图算法猜测的深度图。经过运用额定的无标签RGB数据,优图算法仅运用少数数据就能够到达较好的视觉作用)?

据腾讯优图的研讨员介绍,该研讨办法尽管以单目深度猜测为试验,但过程中发现关于语义切割使命也有类似的作用提高。与此同时,当模型练习与算法布置的环境存在差异时(即存在Domain Shift),若有标签数据为源域中的数据,而无标签数据为算法布置的方针域中的数据,该办法还能够起到Domain Adaptation的作用,提高模型在方针域的布置作用,该调查也在非同源场景下的ReID使命中得到了开始的验证。

总的来说,该项研讨的中心在于充沛发掘无标签样本所包括的信息,削减对标签数据的依靠,未来有望在场景重建、非同源场景ReID等多个计划中进行运用。



bet36在线投注网

亚博|最新推荐