淺談計算機視覺中的圖像标注

計算機視覺的飛速發展離不開大量圖像标注資料的支援，随着各類圖像檢測、識别算法的商業化落地，市場對圖像标注精準度愈發嚴格。每個資料科學任務都需要資料，具體地說，是輸入系統的幹淨易懂的資料。說到圖像，則是計算機需要看到人類眼睛看到的東西。例如，人類有識别和分類物體的能力。同樣，我們可以使用計算機視覺來解釋它接收到的視覺資料，這就是圖像标注的作用。

什麼是圖像标注？

圖像标注是計算機視覺的一個子集，是計算機視覺的重要任務之一。圖像标注就是将标簽附加到圖像上的過程。這可以是整個圖像的一個标簽，也可以是圖像中每一組像素的多個标簽。這些标簽是由人工智能工程師預先确定的，并被選中為計算機視覺模型提供圖像中所顯示的資訊。

需要标注的計算機視覺任務：

1、物體檢測

進行目标檢測的技術主要有兩種，即2D和3D包圍框。

1.1 2D包圍框

2D包圍框隻需要在被檢測物體的周圍繪制矩形框。它用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐标和右下角的x、y軸坐标來确定。

優點：标注起來快速和容易。

缺點：不能提供重要的資訊，如物體的方向，這對許多應用來說是至關重要的。

包括不屬于物體一部分的背景像素，這可能會影響訓練。

1.2 3D包圍框或立方體

較2D包圍框，它還可以顯示目标的深度。這種标注是通過将二維圖像平面上的邊界框向後投影到三維長方體來實作的。3D包圍框允許系統區分三維空間中的體積和位置等特征。

優點：解決了物體方向的問題。

缺點：當物體被遮擋，3D包圍框可以想象包圍框的次元，這可能會影響訓練。

這種标注也會包括背景像素，可能會影響訓練。

1.3 多邊形

在必須标記形狀不規則的物體的情況下，使用多邊形。注釋時隻需标記物體的邊緣，我們就能得到要檢測的物體的完美輪廓。

優點：消除了背景像素，并捕獲了物體的精确尺寸。

缺點：非常耗時

2、線\邊緣檢測（線和樣條）

在劃分邊界時，線和樣條是有用的。将區分一個區域和另一個區域的像素進行标注。

優點：連線上的像素不需要都是連續的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。

缺點：圖像中的線手動标注時是很累人和費時的，尤其是圖像中有很多線時。當物體碰巧是對齊的時候，結果可能會出現誤導。

3、姿态預測\關鍵點識别

在許多計算機視覺應用中，神經網絡會需要識别輸入圖像中重要的感興趣的點。我們把這些點稱為地标或關鍵點。它适用于面部識别，以識别面部特征、表情和情緒。标記圖像标注技術還可以标記身體位置和對齊方式，以及研究身體不同部位之間的關系。

4、分割

圖像分割是将一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。

語義分割-語義分割是一項機器學習任務，它需要像素級标注，其中圖像中的每個像素都被配置設定給一個類。每個像素都帶有語義意義。這主要用于環境背景非常重要的情況。

執行個體分割-執行個體分割是圖像分割的一種子類型，它在像素級别上辨別圖像中每個物體的每個執行個體。執行個體分割和語義分割是圖像分割的兩種粒度級别之一。

全景分割-全景分割結合了語義分割和執行個體分割，所有像素都被配置設定一個類标簽，所有目标執行個體都被唯一地分割。

通過本文，您應該已經了解到圖像标注了。靈智互動已為全球超百家機關提供人工智能基礎資料服務，高效、超值是我們最常聽到的回報。靈智互動的服務遵旨是用最優的資料方案，做最高質的資料，如果您有任何關于資料标注的問題，請随時聯系我們。

——靈智互動——

與靈智互動攜手，引領Ai資料時代，共享智慧碩果。

淺談計算機視覺中的圖像标注

繼續閱讀

yolov7 tensorrt模型加速部署【實戰】

Android-opencv之CVCamera

基于ORB特征點比對的對極幾何限制實作（源碼+講解）

使用hector構圖_如何使用均衡的構圖拍攝更清晰的照片

GMS：基于網格運動統計的快速極度魯棒的特征比對摘要1 簡介2 本文的方法3 應用于快速記分的網格架構4 實驗 5 結論

如何使用前景和背景建立更清晰的照片

在Ubuntu16.04上提取相鄰序列圖像之間的ORB的特征點，并用暴力方法找到比對點并連線一、什麼是ORB特征二、什麼是暴力比對三、實作代碼四、運作方法

Matlab中将二維灰階圖像三維顯示

車道線檢測

自監督｜「CoCLR」視訊自監督對比學習筆記

視訊對象分割（Video Object Segmentation）研究小記任務定義與資料集技術路線分類基于神經網絡的模型總結

opencv視覺跟蹤——消除背景模組化

圖形處理單元(GPU)的演進

2021-09-30三維點雲測量正方形包裹體積

DOG算子

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡