秋招來了,跳槽季馬上到了,大家多看别人的面經提前積攢經驗,多了解幾個熱門&前沿知識點!别在侃侃而談的時候,因為一個開放性問題卡殼,真的很社死!
最近面試的時候,面試官問了我一個問題:
你怎麼看CV中的Transformer的!
當時我就懵了呢!因為前面還在聊技術問題,立馬調整氣勢,說到:
我知道Transformer在NLP方面非常有實力!因為它在分類、檢測等任務上展現了極其強勁的性能。而且骨幹網絡上的發展也推動了下遊任務的發展,Swin Transformer更是成了屠榜般的存在,在工業界具有廣闊的應用前景。
比如:
NLP中的訓練方法是輸入一個句子,蓋住其中的幾個詞,然後要模型預測出蓋住的詞。
非常自然的能夠想到CV中可以這樣訓練:輸入一個圖像,蓋住其中的幾個patch,然後要模型預測出蓋住的patch。
但要想啃透CV Transformer 難度不小:
一方面,Transformer本是應用于NLP的論文,其中很多内容都形成了共識,在論文中并不會去詳細介紹這些共識内容,例如QKV是什麼,embedding是什麼等,對于其他方向的人看到這些就很難了解。
另一方面,近小半年,Transformer+CV的論文就已經有40多篇。學術研究更新之快,與脫發速度成正比

我學習Transformer+CV的論文無非三個步驟:泛讀、精讀、代碼複現。
給大家推薦科研一線——電子羊老師,推出的【CV中的Transformer專題MAE詳解直播】,幫你徹底夯實 CV Transformer 基礎。
PS:在學習MAE之前需要學習前置知識ViT的結構,輸入以及輸出。
↓ 前方福利 ↓
現在預約《MAE》直播僅0.1元
掃描👆二維碼👆
購買MAE直播後添加小享
免費領取VIT論文講解視訊
23号直播劇透
1.《MAE》簡介
1.1研究背景
1.2主要方法
1.3研究成果
2.Pretrain finetune
2.1什麼是backbone?
2.2如何用
2.3一種符合邏輯的推論
3.為什麼分類任務如此重要?
3.1特征提取器在做什麼
3.2分類子產品在做什麼
3.3性能和什麼有關
3.4如何獲得一個好的特征提取器
↓ 前方福利 ↓
現在預約直播僅0.1元
👆掃碼添加客服 即可領取↓
免費領取VIT論文講解視訊
(限99份,手慢無)
3.《MAE》的主要方法
3.1整體結構
3.2什麼是AutoEncoder
3.3高ratio mask&mask高效實作
3.4非對稱設計
還有很多幹貨,大家來看直播吧!
現在預約直播僅0.1元
👆掃碼添加客服 即可領取↓
免費領取VIT論文講解視訊
(限99份,手慢無)