「名詞解釋」影像戰略釋出會

一、理念名詞

1.1-【人性化的專業影像】

vivo希望把各種複雜的影像技術和經驗都放進手機，隻需要簡單地按下快門，就能創作出屬于你的作品。專業創作者可以用它滿足極限環境下的創作需求，普通人也可以通過簡單操作收獲令人動容的影像。這就是vivo所一直追求的“人性化的專業影像”。

1.2-【還原眼之所見，超越眼之所見】

還原，是對客觀世界的記錄；超越，則是把主觀情感投射到影像中，是vivo的影像理念。

二、影像技術矩陣名詞

2.0-【vivo影像技術矩陣】

vivo影像技術矩陣具體分為七個部分：光學感覺系統、臻彩還原引擎、超清畫質引擎、算力加速引擎、環境了解技術、超感人像系統、蒼穹夜景系統；目标達到“三個比肩”：比肩專業影像裝置，比肩專業攝影團隊，比肩專業後期能力。

2.1-【光學感覺系統】

光學感覺系統包括光學模組和鍍膜等技術。比如VCS仿生光譜技術，通過改善Sensor QE光譜，提升信噪比和色彩還原能力，讓傳感器接收的原始資訊不斷接近人眼，打造良好的成像基礎。

2.2-【臻彩還原引擎】

主要支撐技術為智能AWB和智能白加黑減，能夠提升白平衡準确性和大面積“白”“黑”場景的曝光準确性，将vivo的色彩表現和影調觀感優化到極緻。

2.3-【超清畫質引擎】

超清畫質引擎的典型技術為光學超分算法，通過對鏡頭的缺陷模組化分析，恢複了約35%的損失資訊。光學超分算法是實作超清畫質的起點，引擎中還有Denoise、Demosaic、Deblur等子產品，進行耦合訓練，形成了系統性的AI畫質方案——超清畫質引擎。可以實作多幀畫質重建，達到更好的畫質和更廣的動态範圍。

2.4-【算力加速引擎】

算力加速引擎，是一套軟硬結合的加速方案，vivo基于自研晶片和平台SOC設計研發了CV異構加速引擎和vDNN深度學習加速引擎，是分别針對傳統CV算法和AI算法的加速引擎，可支撐多芯結合的異構加速，實作多資訊協同并高速處理。

2.5-【環境了解】

環境了解會對場景進行識别，比如色溫和亮度檢測的技術、運動檢測的技術，基于環境的進行資訊提取，協助3A等子產品，作出最佳的拍攝判斷。

備注：3A技術即自動對焦(AF)、自動曝光(AE)和自動白平衡(AWB)

2.6-【超感人像系統】

超感人像系統三大核心技術子產品：人像了解、人像美化、人像氛圍。

第一步，人像了解——像攝影師一樣讀懂人像資訊

vivo“人像了解技術”會像專業修圖師一般進行分區檢測，對人臉進行語義重點和輪廓細節的提取，建立多達103個特征點的關鍵人臉坐标，點位精度誤差小于2像素。同時，會對畫面中的皮膚、手勢、肢體關鍵點進行檢測，主體分割IOU達到了96.15%的精确度，為靜态人像重塑和動态人像抓拍提供了精細化的處理能力。

第二步，人像美化——微米級人像細節美化

vivo以不同年齡、性别、場景的數以百萬計的素材，經過反複的機器學習成長，推出vivo全新更新的微米級煥膚塑顔技術，使皮膚觀感更加自然、健康，也更好地保留了五官的立體感。

第三步，人像氛圍——營造獨特的氛圍感

vivo對于人像的思考不止于人，人與景的關系是人像的另一個重要的次元。vivo“人像氛圍融合”技術，基于人像語義了解，在影調、色彩、亮度、虛化等層面上進行人與場景的融合處理，實作人與景和諧、自然的效果。

2.7-【蒼穹夜景系統】

蒼穹夜景系統進行全面AI更新，基于百萬夜景照片訓練出三個全新模型：超感光模型、全分割語義模型和臻彩影調模型。超感光模型：将感光能力最大提升了100%，ISO最高可支援102400；全分割語義模型和臻彩影調模型聯合，實作了自适應的影調和色彩調整能力。

三、影像晶片名詞

3.1-【AI-ISP】

在下一代自研晶片的設計中，vivo更新了全新的架構，從傳統ISP架構更新到了AI-ISP架構，實作了跨越式的技術革新。傳統ISP能以極低延時處理大量的資料流水，但是隻能解決已知的、特定的問題。AI擅長處理複雜的、未知的問題，但是延時較大。

AI-ISP結合兩者的優勢，相當于給傳統ISP晶片加一個新的AI大腦，這個AI大腦的神經元分布是網狀結構的，更适合海量的發散式資訊處理。相比于傳統的架構，AI-ISP能夠通過硬體直連的方式将AI計算直接融入ISP Pipeline中，完成資料的無縫緩沖和處理，處理能力、處理能效都有大幅提升。

基于AI-ISP這個架構革新，vivo在下一代自研晶片上實作了三大突破: 片上記憶體單元的突破、AI計算單元的突破、圖像處理單元的突破。

3.2-【vivo自研片上記憶體單元】

作用：提升資料吞吐速率。

行業常用的DDR架構的記憶體單元，采用片外存儲的形式，存在延遲高、功耗高的弊端，限制了資料吞吐速率，限制了視訊類資料推理運算的效率。

為了解決這個問題，vivo在記憶體單元的設計中，堅持使用昂貴的DDR-Less片内近存運算架構，配合硬化在片上的超大SRAM，實作了運算快、延時低的特征，使資料吞吐速率達到了不可思議的1.3萬億比特（bit/s）。

3.3-【vivo自研AI計算單元】

作用：帶來超高的能效比。

vivo選擇了更适合做複雜計算成像運算的DLA加速器。AI算法是資料驅動的。在運算過程中，需要大量的資料比較、拟合。要想進一步突破能效比，就要解決延遲和功耗兩方面的問題。

延遲方面，DLA加速器中内嵌了專用的片上SRAM，并且可以與其他子產品共享自研記憶體單元上的系統緩存，大幅減少了資料通路延遲。

功耗方面，vivo将算法和DLA聯合定制設計，實作了軟硬協同優化。DLA加速器的峰值能效比達到每瓦16.3萬億次運算（Tops/w），妥妥的天花闆水準。

【備注】DLA是Deep Learning Accelerator深度學習加速器的縮寫

3.4-【vivo自研圖像處理單元】

作用：帶來了全新的算法效果。

比如AI-NR降噪算法。結合新的硬體能力，vivo把V1+的NR算法做了AI化的更新，通過AI運算，帶來了更好的夜景畫面細節，夜景降噪效果提升了20%（vivo實驗室）。

再比如HDR影調融合（Tone mapping）算法，配合電影級的3D LUTs色彩風格，可以滿足專業使用者的一級整體調色、二級局部調色的需求。在城市夜景下，動态範圍較之前，理論最大提升4EV。

還有大家熟悉的MEMC插幀算法，也進一步改善了延遲問題，提升了效果。

四、風光/夜景相關技術名詞

4.1-【“智能白加黑減”技術】-影調技術

有經驗的攝影師，會根據主體與所處環境的關系調整曝光，手動增加或者減少曝光，這就是攝影中的“白加黑減”。在X80上，vivo推出了“智能白加黑減”技術。現在vivo又将AE訓練集拓展至原來的5.5倍。将使用者痛點場景進行了影調優化，曝光準确性提升了14%，觀感上更加通透立體。

備注：白加黑減的原理

白加黑減不是适合所有的場景拍攝，隻有在拍攝物體是純白色或純黑色的情況下，相機的智能系統會認為物體過曝或欠曝，會自動降低白色的曝光和拉高黑色的曝光，本身白色和黑色的物體就成了灰白和灰黑的狀态（也就是18度灰），是以要加曝光補償和減曝光補償去還原白色與黑色的純度。

4.2-【SuperRAW】-畫質技術

vivo為專業人士提供更為強大的RAW輸出功能，可以輸出14bit高位深的多幀算法融合SuperRAW檔案，其色彩資訊量是單幀RAW的16倍。理論上可最多承載4.39萬億色的色彩資訊，實作高達15EV的動态範圍。技術首發vivo X70系列。

備注：RAW格式

有高寬容度的特點，這是源于它記錄了大量的原始資料，是以使用者可以在原始資料所記錄的範圍内做自由調整，實作照片的美化及校正處理。

4.3-【光學超分算法】-畫質技術

手機因為體積限制，導緻在光學上做了一些妥協。以潛望攝像頭為例，原始圖像經過鏡頭之後會損失50%的資訊。為了改善這種現象，vivo研發了“光學超分算法”，通過對鏡頭的缺陷做模組化分析，恢複了約35%的損失資訊。

“光學超分算法”隻是實作超清畫質的起點，vivo耦合了Denoise、Demosaic、Deblur等子產品，經過1億多次的場景訓練，将上一代算法深度運算能力提升10倍，建構了全新的超清畫質引擎，将畫質處理從單點方案，更新為系統性的AI解決方案。

4.4-【VCS仿生光譜技術】-畫質技術

VCS仿生光譜技術（vivo Camera-Bionic Spectrum）

光線在進入感光元件時，會先通過color filter，而普通圖像傳感器的color filter光譜與人眼差異很大，需要經過複雜處理後，才能還原人眼所感覺的資訊，這個處理過程會導緻畫質變差。VCS技術，就是通過改進color filter，讓傳感器接收的原始資訊不斷接近人眼，進而實作更好的噪聲表現和色彩還原，信噪比提升20%, 色彩還原提升15%。

【備注】VCS仿生光譜技術，在光學感覺環節。和華為計算光學不同，華為的計算光學更像我們的光學超分算法，是感覺後的補償動作。

4.5-【RGBW技術】-畫質技術

RGBW技術是在原有的RGB三原色上增加了W白色子像素，成為四色型像素設計，是sub pixel rendering技術方式。在新的像素排布方式下實作色彩表現的一緻性。同時大幅度提升了液晶面闆的透光率，在顯示相同亮度的畫面時，其耗電量更低;而相同功耗的情況下，亮度大幅提高，這使得畫面層次更加分明，畫面更通透。

【備注】X80上已釋出技術，作為補充輸入

五、人像相關技術名詞

5.1-【人像了解技術】

vivo“人像了解技術”會像(click)專業修圖師一樣進行分區檢測，分析人臉的語義重點和輪廓細節，建立多達103個特征點的關鍵人臉坐标，平均點位精度誤差小于2像素。同時，會對畫面中的皮膚、手勢、肢體關鍵點進行檢測，主體分割 IOU達到了96.15%的精确度，為靜态人像重塑和動态人像抓拍提供了精細化的處理能力。

5.2-【微米級煥膚塑顔技術】

利用類似人工智能訓練生成對抗網絡技術，不斷地通過修圖器跟修圖評估器的博弈來找到修圖最好的方向。訓練過程簡言之就是，給AI一張圖檔讓算法修圖，然後去判斷，同樣一張圖跟修圖師精修出來的圖檔相似程度如何，根據判斷結果實作AI算法的不斷進化。vivo通過對不同年齡、性别、場景的數以百萬計的素材的反複的機器學習，打造了全新更新的“微米級煥膚塑顔技術”，使皮膚觀感更加自然、健康，也更好地保留了五官立體感。

5.3-【人像氛圍融合技術】

基于人像語義了解，vivo“人像氛圍融合”技術在影調、色彩、亮度、虛化等層面上，進行人與場景的融合處理，實作人與景和諧、自然的效果。

5.4-【深度感覺虛化】

深度感覺虛化，是一項vivo的算法技術。想要還原鏡頭的成像，一定要通過深度計算獲得圖檔的深度資訊，并給予圖像合理的虛化效果。vivo的虛化算法結合了雙目深度圖和人像、手勢分割，采用了深度卷積網絡，保證焦内主體清晰。焦外物體的虛化程度也是有講究的，前景到焦平面，焦平面到遠景，每個鏡頭各不相同，但vivo都建立了虛化模型，通過函數計算虛化的程度和光斑大小，最終呈現出景深範圍内清晰，景深範圍外深度漸進的3D-pop虛化效果。

六、視訊相關技術名詞

6.1-【HDR影調融合算法】

HDR影調融合技術主要是與視訊相關的技術，包括一級整體調色和二級局部調色，同時動态範圍也會較之前理論最大提升4EV。

【備注】跟XDR技術、Super HDR有什麼不同

XDR技術為顯示技術；
Super HDR為拍照技術，目前已經更新到RAWHDR技術。

6.2-【專業LOG模式】

「名詞解釋」影像戰略釋出會

繼續閱讀

5G小型蜂應用指南

Cesium格式3dtile制作工具

PAT (Advanced Level) Practise 1012 The Best Rank (25)

mysql5.7的sql優化

線程通信和程序通信差別（線程程序差別）

Matlab随機波動率SV、GARCH用MCMC馬爾可夫鍊蒙特卡羅方法分析匯率時間序列

微信小程式前端解密擷取使用者資訊

Spring MVC 自學雜記（五） -- SpringMVC與前台的json資料互動

《MySQL技術内幕：InnoDB存儲引擎》筆記

擴容TIKV節點遇到的坑

PHP輔導代做程式設計：CS353 Database System

自學Zabbix3.10.2-事件通知Notifications upon events-Actions報警配置點選傳回：自學zabbix集錦

HDU 5678 ztr loves trees

拓端tecdat|R語言彈性網絡Elastic Net正則化懲罰回歸模型交叉驗證可視化

二叉樹及其應用--二叉樹建立

詳解STM32單片機的堆棧