前言

近年來深度學習模型在視覺任務上取得了巨大的成功，但這種成功有一部分原因來自于龐大的标記資料以及大量的計算資源，這使得這些模型在處理幾乎沒有标記資料的新類時顯得非常乏力。對于我們人類來說，在識别物體時，僅需少量的圖像，或者甚至不需要圖像而僅僅根據對物體的描述，就能根據以往的知識來識别物體。這是由于我們人類有先驗知識，我們會利用自己的先驗知識進行學習。如何讓模型能夠實作這種快速學習呢？元學習（meta learning）就是一種方法，也即學會學習。

本文就是利用對比來實作元學習，通過學習一個可轉移的深度度量來比較圖像之間的關系，即小樣本學習；或者比較圖像與類描述之間的關系，即零樣本學習。現有的小樣本學習方法通常将訓練分解為一個輔助的元學習階段，在該階段中，以良好的初始條件、embedding或優化政策來學習可轉移的知識，也就是先驗知識。但是這些方法要麼需要複雜的inference機制，要麼需要複雜的RNN結構，要麼通過優化政策進行微調來進行小樣本學習，總之就是很複雜就對了，而本文提出的方法很簡潔，也很靈活。

具體來說就是，提出了一個具有兩個分支的Relation Network（RN），它通過比較query圖像與每個新類中的少量樣本圖像之間的關系，來進行小樣本學習：

首先，嵌入子產品（embedding model）為query和training圖像生成各自的embedding；
然後，通過一個關系子產品（relation model）對這些embedding進行比較，判斷它們的類别是否比對。

RN的訓練同樣采用了episode政策，嵌入子產品和關系子產品都是端到端的元學習，注意RN中是一種可學習的非線性比較器，也就是一種可學習的非線性度量，這與MatchingNet和PrototypicalNet不同，MatchingNet中使用的是餘弦距離，PrototypicalNet中是固定的線性度量，即平方歐氏距離。本文的RL比其它的方法更簡單，因為沒有使用RNN；也比其它的方法更快，因為沒有微調。而且RL也可以直接泛化到零樣本學習中，即在關系模型中比較query圖像的embedding與類描述的embedding即可。

實作方法

1. 資料處理

對于小樣本學習任務，有三種資料集：訓練集，支援集和測試集。支援集和測試集共享同一個标簽空間，而訓練集有自己的标簽空間，并且不和另外兩種資料集共享。如果支援集中有 C C C個類，每個類有 K K K個帶标簽的樣本，那麼就可以稱為 C C C-way K K K-shot。

雖然隻用支援集原則上也可以訓練出一個分類器，以将标簽 y ^ \hat y y^分類給測試集中的樣本 x ^ \hat x x^，但由于支援集中缺少帶标簽的樣本，由此訓練出的分類器的性能并不能讓人滿意。是以就要在訓練集上進行元學習，以提取出先驗知識，進而可以更好的在支援集上進行小樣本學習，進一步更好的對測試集進行分類。

一種有效利用訓練集的方法就是通過基于episode的訓練來模拟小樣本學習。在每次疊代中，一個episode是指，從訓練集中随機選出 C C C個類别，每個類中選擇 K K K個帶标簽的樣本作為一個樣本集（sample set） S = { ( x i , y i ) } i = 1 m S=\lbrace (x_i,y_i) \rbrace ^m_{i=1} S={(xi,yi)}i=1m，然後從每個類剩下的樣本中選出一部分作為查詢集（query set） Q = { ( x j , y j ) } j = 1 n Q=\lbrace (x_j,y_j) \rbrace ^n_{j=1} Q={(xj,yj)}j=1n，該樣本/查詢集旨在模拟測試時遇到的支援/測試集，通過樣本/查詢集訓練的模型也能用支援集來進一步微調。本文的實驗就是用的這種基于episode的訓練政策。