檔案篡改識别的困惑

這周總結

這周完成了多媒體技術課程的presentation，我們組的課題是mtcnn來進行人臉檢測，不過選題和課程關系不大，課程講解的更多是MPEG和H264的知識。選題是小組讨論的結果，這個presentation是中期彙報，報告我們大緻完成了什麼。我們組用mtcnn完成了基本的訓練，能夠檢測識别出圖中人臉的數目和位置，不過有的效果不是很好，比如不能很好地檢測人臉的雕像（兵馬俑之類的），但是對于動漫中的臉還是基本能準确識别是非人臉，我們下一階段的目标是看能否對其進行改進。

天池大賽

由于上課較多，還每周有課程的彙報，天池大賽雖然報名參加了，但是也是到了上周我才把model、train、test初步寫完了。model的整體思想和上一篇部落格說的論文思想差不多，先進行最大值濾波器過一遍圖檔，再丢到卷積神經網絡學習。不過沒有機子，我在colab上面訓練，但是效果很差。

仔細思考之後是使用的loss函數不行，我使用的loss函數是BCELoss，目前還沒找到好的解決辦法。在想自己寫損失函數對我來說其實不太現實，但是想想，對于之前的我來說，自己寫模型，train，test好像也很不現實，努力改進，相信會進步的。不過比賽截止時間要到了，還是太菜了，怎麼能這麼菜。

就是檔案篡改識别這個題目中，資料中被改動的部分很小，神經網絡有惰性，不進行學習，每次預測都是直接預測全部都未發生篡改，整體的loss也很小。現在是知識的儲備不足，讓我覺得很無能為力。

下一步打算看看相關的論文，别人是怎麼使用損失函數的，或者别人的其他解決思路，希望有所收獲，或者等比賽結束後，看看冠軍代碼，還需要進步。