本書分為六部分,如圖1-2所示。
本書的第一部分涵蓋機率方面的背景知識。全書中所有的模型都是用機率的術語表示,機率是計算機視覺應用中一門很有用的語言。具有紮實工程數學背景的讀者或許對這部分知識比較熟悉,但仍需要浏覽這些章節以確定掌握相關的符号。那些尚不具備該背景的讀者應該仔細閱讀這些章節。這些知識相對比較簡單,但它們是本書其餘部分的基礎。在正式提到計算機視覺知識前被迫閱讀三十多頁的數學雖然令人沮喪,但請相信我,這些基礎知識将為後續的學習提供堅實的基礎。

圖1-2 章節依賴關系。本書分為六部分。第一部分是機率綜述,是所有後續章節的基礎。第二部分涉及機器學習和推理,主要描述生成模型和判别模型。第三部分讨論圖模型,主要是大的模型中變量之間機率依賴關系的可視化表示方式。第四部分介紹預處理方法。第五部分涉及幾何與變換。第六部分提出幾個重要的視覺模型
本書第二部分介紹計算機視覺中的機器學習。這些章節講述機器視覺的核心原理,幫助讀者鞏固從圖像中提取有用資訊的方法。建立統計模型,建立圖像資料和期望擷取資訊之間的關系。掌握這些後,讀者應該了解如何建立一個模型來解決視覺領域的幾乎所有問題,即使這種模式可能還不是很實用。
本書第三部分介紹計算機視覺的圖模型。圖模型為簡化圖像資料和期望評估的屬性間關系提供一個架構。當這些量都是高維時,它們之間的統計關系變得相當複雜。即使如此,我們仍可以定義相關的模型,但我們可能缺乏使其有用的訓練資料或計算能力。圖模型提供了一個有原則的方式來推測資料和世界屬性之間的統計關系。
本書第四部分讨論圖像預處理。對于了解本書中的大部分模型這不是必需的,但并不是說這部分就不重要。預處理政策的選擇至少跟模型的選擇一樣至關重要,這決定了一個計算機視覺系統最終的性能。雖然圖像處理不是本書的主題,但是這部分提供了最為重要和實用的技術總結。
本書第五部分緻力于幾何計算機視覺;它介紹針孔錄影機——一個用來描述三維空間中給定點在相機像素陣列中成像的數學模型。跟這個模型相關的是尋找特定場景的相機位置和重建物體三維模型的一整套技術。
最後,本書第六部分基于前面的原理,給出幾組視覺模型。這些模型緻力于計算機視覺最為核心的若幹問題,包括人臉識别、跟蹤和目辨別别。
本書最後是附錄。其簡述書中使用的符号約定,并概括線性代數和優化技術。雖然這些知識在其他文獻也能找到,但是這些内容會使得本書更加完備,并且保證在正文以統一的術語來讨論。