讀論文七步走！CV老司機萬字長文：一篇論文需要讀4遍

新智元報道

編輯：LRS

【新智元導讀】讀論文對于AI新手和工程師來說可能是一件比較難的事。最近一位從業超5年的CV老司機釋出了一篇萬字長文，講述了讀論文七步法，從找論文到總結，每篇論文由淺入深都需要讀4遍。

人工智能從業者需要讀論文嗎？

機器學習的各種模型發展日新月異，想要走在技術的最前沿，不看論文，光看部落格、技術文檔是遠遠不夠的。

但随着AI研究從業者逐漸增多，各類科普、教程做的實在是太好了，一些大學生甚至初、高中生都能利用工具來訓練自己的模型到現實中的應用。

但對于那些缺乏學術背景、沒有系統學習過如何寫論文的人來說，讀一篇學術論文可能比訓練一個模型要難太多了。

并且如果在訓練模型過程中有了一些創新的想法，想要發表一篇論文，但讀論文都讀不好的話，那寫論文肯定也會出問題。

最近Nvidia developer上就有一篇部落格用萬字長文，七步教會你如何「務實地」讀論文。

部落格作者Richmond Alake是一名機器學習和計算機視覺工程師，主要工作就是幫助各種初創公司開發深度學習模型來解決商業應用中的計算機視覺任務，技術領域的從業時間超過5年。

除此之外，他還是一個部落格專家，寫過100多篇關于人工智能和機器學習主題的文章，總浏覽量超過一百萬。

天才第一步：選個好題目

機器學習和資料科學領域有大量可供研究的主題領域，但這并不一定意味着每個研究課題都是好的選擇。

對于初入AI行業的人來說，可能更關注于機器學習的各種應用場景，但如果考慮到長期的職業前景的話，那些專業術語又讓AI新手感到迷茫。

是以确定一個研究主題是很困難的，對每個人來說，好題目的定義都是不一樣的，不過有一點是相同的，要選擇一個感興趣的或者已經有經驗的機器學習領域。

對于部落格作者來說，深度學習就是他的興趣。

Richmond表示他當時「誤入」計算機視覺的原因就是因為對姿态估計、動作分類、手勢識别這些課題特别感興趣，開發深度學習模型解決CV問題也會讓他覺得很有成就感。

不同領域的工程師也需要不同的專業技能。

如果你的目标是自然語言處理工程師，那你就需要研究Transformer，RNN，語言模型，情感分類等等。

對于資料科學家來說，需要更關注資料增強，資料可視化，模式識别的技術。

在這篇部落格中，作者選擇他比較熟悉的姿态估計（Pose Estimation）為例來介紹。

第二步：找論文

讀論文，最重要的就是找到主題相關的、優質的論文。

PapersWithCode是一個比較常用的工具，能夠幫助研究人員快速找到機器學習相關的論文，并且還會把論文相關的資料集、代碼和其他資源都一起呈現出來。

在網站中搜尋Pose Estimation後，就會把相關的資料集、性能最佳的模型等列出來。

例如當你鎖定一篇論文後，就可以點到詳情頁，看到相關資訊。

第三步：讀論文

确定完主題、找到合适的論文後，我們終于要開始讀了。

每一篇論文的格式實際上都是「八股文」，采用固定的格式進行編寫，這種格式既能幫助論文作者梳理思路，也能幫助讀者快速定位文章中的創新點。

對于研究新手來說，拿到一篇論文的第一個想法就是從頭到尾地把論文讀一遍，然後開始做筆記，這種想法雖然無可厚非，但肯定不是最高效讀論文的一種方式。

更實用的一種閱讀方法是先了解論文研究的背景，「标題」、「摘要」和「結論」部分是快速了解論文内容的三個關鍵部分。

在第一遍讀完論文後需要達成三個目标：

1、确認這篇論文和自己的研究内容是相關的

2、讀完論文的内容、方法和結論後，能夠對論文的研究背景和意義有所了解

3、認識到文章的主要創新點，總結論文作者的目标、方法和主要貢獻

第四步：再讀一遍論文

第二遍讀論文的主要目的就是熟悉論文的内容。和讀第一遍一樣，不要直接讀論文的核心内容，隻有充分了解論文的背景、研究出發點才能更好地了解論文。

第二遍主要從「引言」和「圖表」入手。

引言部分概述了研究工作的目标，會解釋論文中的問題域、研究範圍、先前的研究工作和方法。能夠幫助讀者找到該領域過去的相似研究工作，為讀者拓寬了探索思路，引言部分也為讀者提供了了解論文所需的必要知識。

圖示的話屬于論文中的說明性材料，能夠幫助讀者了解論文中的研究問題，并對文中所提出的方法進行解釋。表格也能夠對論文中涉及到的相關方法進行量化分析。

對于深度學習來說，模型架構圖也是必不可少的，有時候讀一篇論文隻看架構圖就能了解了文章的主要工作。

第五步：再再讀一遍

第三遍要更加深入地讀論文，但文章中的公式、不熟悉的術語都可以跳過。

從摘要到結論重新看一遍，在讀完每個章節後都休息一下，将所有想法、見解、收獲和不熟悉的概念一起記下來。

并且讀論文時要有節奏，一個比較有效的學習方法是學50分鐘，然後休息15分鐘。如此學習兩次以後，可以休息30分鐘以上來幹點别的事。

如果還不熟悉這種節奏的話，可以從學25分鐘休息5分鐘開始練習。

第六步：再再再讀一遍

這次是最後一遍讀論文了，但也是最難的、最考驗思維和學習能力的一遍。

你需要将前面遇到的所有不了解的、不熟悉的術語、公式、名詞、概念、算法都進行深入研究。最重要的就是利用外部資源來幫助了解論文，例如相關文獻、搜尋引擎、同學的讨論等等。

最後一遍讀論文所需時間通常是不固定的，幾個小時、幾天甚至幾周都有可能。并且你在搜尋引擎中可能也找不到論文的相關讨論，這就需要你來思考、實踐或者聯系作者來尋找答案。

第七步：總結

把論文中的内容用自己的話重新總結出來能夠幫助你對論文内容加深了解，確定學到的知識可以記得更長遠一點。

不管是手寫還是打字總結，都能夠幫助加強記憶。

毋庸置疑，AI從業人員必須要學會讀論文，而初學者往往很難入手。通過這樣一遍遍、有規則地讀論文，能幫你快速掌握、了解論文中的内容。

參考資料：

https://developer.nvidia.com/blog/how-to-read-research-papers-a-pragmatic-approach-for-ml-practitioners/

讀論文七步走！CV老司機萬字長文：一篇論文需要讀4遍

繼續閱讀

人工智能帶來育兒焦慮，澳洲華人家長為子女的未來憂愁

OpenAI o1與人工智能的過去與未來

未來不會被人工智能取代的4個領域，第1個最穩，第4個成本效益最高

Adobe的Project Turntable人工智能工具可在三維空間中旋轉二維藝術作品

陳健淋｜通用人工智能視野下企業資料賦權的類型展開

科學家利用新型人工智能揭開嬰兒學習和發育的秘密

南沙和華為強強聯手！共建人工智能生态基地

2025年人工智能十大趨勢！最新預測→

張藝謀透露《三體》進度：隻拍一部、大幅删改、引入人工智能

法蘭克福書展聚焦人工智能發展與監管

人工智能未來十大趨勢

研學報道|“探索科技前沿引領未來創新”人工智能創新應用博覽會研學之旅啟航

論壇直擊|人工智能創新應用發展領航交流會圓滿舉辦

數字科技、人工智能拯救春晚收視率

DeepSeek出世，人工智能厲害，教師會被取代嗎？讀書還有意義嗎？

一邊大量失業一邊搞人工智能，發展搶了幾億人飯碗，未來怎麼辦？