首页 理论教育 典型应用:多模态和多任务学习

典型应用:多模态和多任务学习

时间:2023-06-22 理论教育 版权反馈
【摘要】:多任务学习是机器学习的一种方法,它是指在同一时间用同一种共享的表示来学习和解决一些相关问题的方法。深度学习的本质是自动地发掘任意一种机器学习任务中有效的特征或表示,其中包括从一个任务到另一个任务即时的知识转移。很明显,复杂的多任务学习很符合深度学习或者表示学习的要求。本章中,我们精心挑选了这个领域内的一些应用进行详细地阐述,它们是按照模态间的不同组合或者不同的学习任务进行组织的。

典型应用:多模态和多任务学习

多任务学习(multi-task learning)是机器学习的一种方法,它是指在同一时间用同一种共享的表示来学习和解决一些相关问题的方法。它可以看作是迁移学习(transfer learning)或者知识迁移学习的两大主要类别之一,研究重点是分布、领域或者任务上的泛化。另一种主要的迁移学习叫做适应性学习(a-daptive learning),在这类学习中,知识迁移是以一定顺序进行的,从源任务到目标任务的迁移是其中的一个代表[95]。多模态(multi-modal)学习与多任务学习是紧密相关的,这些学习领域或“任务”涵盖了人机交互的多个模态或者包含兼有文本、语音、触感和视觉信息资源的其他应用。

深度学习的本质是自动地发掘任意一种机器学习任务中有效的特征或表示,其中包括从一个任务到另一个任务即时的知识转移。多任务学习通常用于目标任务领域训练数据匮乏的情况,因此有时也称之为零样本(zero-shot)或单样本(one-shot)学习。很明显,复杂的多任务学习很符合深度学习或者表示学习的要求。在资源匮乏的机器学习场景中,共享的表示以及任务中(包括语音、图像、触感和文本等不同模态的任务)所使用的统计方法的力量将会体现得淋漓尽致。在使用深度学习方法之前,多模态和多任务学习已经有很多的研究工作,例如,文献[175,103]提出并阐述了一个叫做MiPad的多模态交互原型,该原型能够捕捉、学习、协调以及渲染语音、触觉和视觉的混合信息。在文献[354,443]中,利用不同传感特性的麦克风来采集骨传导以及空气传导路径的混合声源,进行语音降噪。这些早期的研究都使用浅层模型和学习策略,得到的结果也差强人意。随着深度学习的出现,复杂的多模态学习问题看到了曙光,一旦这一难题被攻克,实际应用将会如雨后春笋般层出不穷。本章中,我们精心挑选了这个领域内的一些应用进行详细地阐述,它们是按照模态间的不同组合或者不同的学习任务进行组织的。本章叙述的内容有很多依然是研究热点,研究人员应该多关注后续出版物。(www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈