天天看點

檔案篡改識别的困惑

這周總結

這周完成了多媒體技術課程的presentation,我們組的課題是mtcnn來進行人臉檢測,不過選題和課程關系不大,課程講解的更多是MPEG和H264的知識。選題是小組讨論的結果,這個presentation是中期彙報,報告我們大緻完成了什麼。我們組用mtcnn完成了基本的訓練,能夠檢測識别出圖中人臉的數目和位置,不過有的效果不是很好,比如不能很好地檢測人臉的雕像(兵馬俑之類的),但是對于動漫中的臉還是基本能準确識别是非人臉,我們下一階段的目标是看能否對其進行改進。

天池大賽

由于上課較多,還每周有課程的彙報,天池大賽雖然報名參加了,但是也是到了上周我才把model、train、test初步寫完了。model的整體思想和上一篇部落格說的論文思想差不多,先進行最大值濾波器過一遍圖檔,再丢到卷積神經網絡學習。不過沒有機子,我在colab上面訓練,但是效果很差。

仔細思考之後是使用的loss函數不行,我使用的loss函數是BCELoss,目前還沒找到好的解決辦法。在想自己寫損失函數對我來說其實不太現實,但是想想,對于之前的我來說,自己寫模型,train,test好像也很不現實,努力改進,相信會進步的。不過比賽截止時間要到了,還是太菜了,怎麼能這麼菜。

就是檔案篡改識别這個題目中,資料中被改動的部分很小,神經網絡有惰性,不進行學習,每次預測都是直接預測全部都未發生篡改,整體的loss也很小。現在是知識的儲備不足,讓我覺得很無能為力。

下一步打算看看相關的論文,别人是怎麼使用損失函數的,或者别人的其他解決思路,希望有所收獲,或者等比賽結束後,看看冠軍代碼,還需要進步。