迁移学习系列-3-王晋东迁移学习手册阅读

迁移学习的定义

迁移学习,是指利用数据、任务、或模型之间的相似性,将在旧领域学习过的模型,应用于新领域的一种学习过程。

综述文章: A survey on transfer learning [Pan and Yang, 2010]

为什么要学习迁移学习?

  1. 缺少数据标注
  2. 缺少足够算力
  3. 普适化模型与个性化需求之间的矛盾
  4. 特定应用需求

迁移学习如何解决这些问题: 1. 大数据与少标注:迁移数据标注 2. 大数据与弱计算:模型迁移 3. 普适化模型与个性化需求:自适应学习 4. 特定应用的需求:相似领域知识迁移(比如cross-lingual)

迁移学习与传统机器学习的区别:

迁移学习与领域自适应的区别:

领域自适应问题是迁移学习的研究内容之一,它侧重于解决特征空间一致、类别空间一致,仅特征分布不一致的问题。而迁移学习也可以解决上述内容不一致的情况。

迁移学习的常用分类

按照目标域标签分类

  1. 监督迁移学习 (Supervised Transfer Learning)
  2. 半监督迁移学习 (Semi-Supervised Transfer Learning)
  3. 无监督迁移学习 (Unsupervised Transfer Learning)

按照学习方法分类

  • 基于实例的迁移学习方法 (Instance based Transfer Learning):
  • 基于特征的迁移学习方法 (Feature based Transfer Learning)
  • 基于模型的迁移学习方法 (Model based Transfer Learning)
  • 基于关系的迁移学习方法 (Relation based Transfer Learning)

基于实例的迁移,简单来说就是通过权重重用,对源域和目标域的样例进行迁移。就是说直接对不同的样本赋予不同权重,比如说相似的样本,我就给它高权重,这样我就完成了 迁移,非常简单非常非常直接。

基于特征的迁移,就是更进一步对特征进行变换。意思是说,假设源域和目标域的特征 原来不在一个空间,或者说它们在原来那个空间上不相似,那我们就想办法把它们变换到一个空间里面,那这些特征不就相似了?这个思路也非常直接。这个方法是用得非常多的,一 直在研究,目前是感觉是研究最热的。

基于模型的迁移,就是说构建参数共享的模型。这个主要就是在神经网络里面用的特别多,因为神经网络的结构可以直接进行迁移。比如说神经网络最经典的 finetune 就是模型参数迁移的很好的体现。

基于关系的迁移,这个方法用的比较少,这个主要就是说挖掘和利用关系进行类比迁移。比如老师上课、学生听课就可以类比为公司开会的场景。这个就是一种关系的迁移。

按照特征分类

  • 同构迁移学习 (Homogeneous Transfer Learning)
  • 异构迁移学习 (Heterogeneous Transfer Learning)

这也是一种很直观的方式:如果特征语义和维度都相同,那么就是同构;反之,如果特征完全不相同,那么就是异构。举个例子来说,不同图片的迁移,就可以认为是同构;而图片到文本的迁移,则是异构的。

按离线与在线形式分

  • 离线迁移学习 (Offline Transfer Learning)
  • 在线迁移学习 (Online Transfer Learning)

迁移学习的应用

计算机视觉

在 CV 领域,迁移学习主要是方法是领域自适应 domain adaption. 侧重于解决特征空间一致、类别空间一致,仅特征分布不一致的问题。

个人理解:在图像上,即使类别差别很大,但是在特征空间上仍然是一致的,或者说有很多相似之处。比如人和狗,从轮廓、颜色、五官等等特征都是具有可迁移性的。再比如人和桌子,也是具有相似特征的。

那么问题是,特征空间完全一致吗?不一致的部分呢?

文本分类

由于文本数据有其领域特殊性,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上。这就需要用到迁移学习。例如,在电影评论文本数据集上训练好的分类器,不能直接用于图书评论的预测。这就需要进行迁移学习。图 11是一个由电子产品评论 迁移到 DVD 评论的迁移学习任务。

那么问题来了,这种从一个domain 迁移到另一个 domain,到底改变了什么?比如同样一个词,在 电子产品中对应的 vector 经过迁移后(finetune?),发生了怎样的变化,这个可以可视化嘛?

时间序列

  • 行为识别(Activity Recognition)
  • 室内定位 (Indoor Location)

医疗健康

不同于其他领域,医疗领域研究的难点问题是,无法获取足够有效的医疗数据。在这一领域,迁移学习同样也变得越来越重要。