天天看點

我是AI工程師,卻在豬廠做“美容”

我是AI工程師,卻在豬廠做“美容”

文|文斌

2022江蘇衛視跨年演唱會上,周深與鄧麗君一曲跨越時空的合唱讓人久久不能自已。但當人們從歌曲的旋律中回過頭來,大家更感興趣的,或許是鄧麗君這樣虛拟形象應當如何建構。

畢竟,元宇宙已經來了,而在這個顔值即正義的時代,我們真實的長相沒得選擇,元宇宙的長相卻可以定制。

有需求就會有市場,讓人在虛拟世界“長”出一張好看的臉這件事自然也早就有人在做。

2021年年初,Epic Game公司旗下的虛幻引擎平台釋出了一款新的工具MetaHuman Creator,宣稱能夠讓任何人在幾分鐘裡創造一個配備完整骨骼、毛發和服裝的數字人形象。

在南韓,有人已經通過MetaHuman Creator制造的虛拟形象在遊戲直播平台上成為網紅,年入千萬。在國内,類似的AI捏臉技術其實也早已在《逆水寒》《天谕》《永劫無間》等諸多遊戲中落地。

然而,作為AI捏臉技術的建構者,AI捏臉師的幕後故事卻不太被人們所知。

但最近,随着元宇宙概念的風起,在虛拟世界裡塑造一個更真實的人物形象成為建設元宇宙的基礎技術之一,像晚豐一樣長期從事AI捏臉技術研究的工程師們也開始被推到了前台。

是以這一次,商業資料派也訪談了網易伏羲的幾位AI“捏臉師”,看看在他們眼中,一個新興的職業從幕後到台前,究竟經曆了怎樣的故事?而面對已經乘風而起的元宇宙,他們又期望技術給世界帶來怎樣的改變?

顔值即正義的虛拟世界,捏臉是第一步

顔值即正義,進入元宇宙的第一步就是建立一個虛拟形象。

經常玩遊戲的朋友都會知道,為了增強體驗,現在很多遊戲都會設定一個環節,讓玩家可以為自己的角色親手塑造一個形象。

2013年,南韓遊戲廠商NCSoft推出的一款主打東方武俠和捏臉系統的遊戲《劍靈》在國内爆火。從此之後,捏臉系統就逐漸成為了絕大多數MMORPG類遊戲中不可或缺的一部分。2018年,網易推出一款大型端遊《逆水寒》,其中就包含了捏臉系統。

我是AI工程師,卻在豬廠做“美容”

(圖:遊戲《劍靈》中的捏臉效果)

“當時的捏臉系統很複雜,幾十上百個滑塊,調整各種參數,普通玩家要好幾天才能捏出一個自己的形象。”AI捏臉師,網易伏羲視覺技術負責人神秀說道:“這個流程太複雜,我們希望開發一個AI算法,讓每一個使用者都能用一張照片在遊戲中快速建立讓自己滿意的形象。”

“我們最初的構想是,希望AI能夠模仿真實人類在捏臉時的回報,比如我先捏一個初稿,然後和使用者上傳的圖像對比,看看哪裡不像,比如說眼睛、嘴巴,然後再針對性地去調整。然後再對比,再調整,如此反複,最終讓兩者無限的接近一緻。”

說起來容易,但做起來卻并不簡單。

“剛拿到這個課題的時候是最難的。”神秀告訴商業資料派:“因為整個業界在之前都沒有人做過這個事,沒有先例可以借鑒。”

首先就是如何捏臉的問題,當時伏羲内部其實也從不同角度讨論了許多方法,但最終隻有兩種是比較成熟可行的。

一種是從骨骼捏臉的角度去做嘗試,這種方式比較成熟,也比較适合現有的一套産業化流程,是以在遊戲中落地也比較容易。但它的缺點就是沒有那麼像。

另一種方案就是從人臉重建的角度去嘗試,這套方案可以完全重建人臉的三維貼圖,甚至人臉皮膚的每一個褶皺。但它的缺點就是計算的耗時會比較長,然後同步也會比較困難,這也讓它不太适合遊戲的場景。

我是AI工程師,卻在豬廠做“美容”

(圖:網易伏羲捏臉的技術原理)

确定了如何捏臉,第二個問題就是如何落地。網易伏羲技術負責人木白告訴我們,捏臉這項技術,早期主要就是服務雷火遊戲,是以直接的問題就是如何與遊戲系統相結合。

按照最初的設計,捏臉系統采用深度學習算法編寫。但要與遊戲相結合,就需要把遊戲的渲染系統引入到深度學習算法裡面去調優。而問題是,遊戲的渲染系統沒有辦法讀懂AI的數學參數。

面對這些問題,再三衡量之後,伏羲最終決定在基于神經網絡算法的基礎上再開發一套遊戲渲染系統,進而将整個pipeline(綜合解決方案)打通。

我是AI工程師,卻在豬廠做“美容”

在一系列研發的問題解決之後,本以為之後的工作會輕松一些,但另一個新的問題又出現了,而且這個問題還是一直埋頭開發的程式員們之前一直沒想到的。

“使用這套系統,需要玩家上傳一張照片的,是以在遊戲中我們會提示玩家上傳一張正臉照片。”神秀告訴我們:“在我們的預想中,玩家提供的照片是正臉、角度正常、然後光照是均勻的、手也不要抖。”

“但大多數玩家不會聽你的,即使你的提示寫的很誠懇,他們也是随便一拍完事。這樣自動捏臉的效果肯定就不會好,是以許多玩家就會說,這個系統真垃圾。”

“我們肯定也會感到很委屈,但也很快認識到自己的錯誤。”神秀回顧道:“我們一開始預設的是一個理想的實驗室環境,真實的線上環境肯定不是這樣的,它會面臨許多幹擾,比如拍攝時的光照,不同裝置的拍攝條件,是否手抖等等。”

“另一個錯誤則是,我們一開始設想的是讓玩家來配合技術,而不是技術去适應玩家,是以沒考慮到之前那些問題。”

根據這些情況,網易伏羲團隊依靠提高算法的魯棒性,讓随手拍的照片都能被識别。除此之外,還對算法做了進一步的加速,減少了玩家的等待時間,也會适當地對虛拟形象做一些美化。

在與玩家不斷的“碰撞”下,捏臉系統也逐漸得到完善。

技術男學化妝

雖然AI捏臉的開發過程并不容易,但事實上,有些難題反而會讓這個過程變得更加有趣。

“你肯定很難想象我們一堆做技術的直男,會去看美妝視訊,研究口紅色号。”神秀笑談道。

事情起因,神秀和同僚們在做捏臉算法的時候,發現許多女玩家會傾向于把自己好看的照片,比如美顔或者妝後的照片拿上來,這和男玩家有很大不同,男玩家可能就是随便拍一下。

“在我們最初的認知裡,女生化妝就等于塗口紅嘛。是以就想加一個口紅,相當于給女玩家的捏臉加上了妝容。”神秀回憶道:“我們幾個男生也讨論過,比如說口紅有幾種顔色,但是我們沒有人知道,是以最後就随便拍闆定了三種顔色認為應該足夠了。”

“後來這件事情被産品經理發現了,我們就被噴了。”神秀有些不好意思:“我們産品是個女生,她告訴我們口紅有多少種色号。而不止我們之前定的紅色、橘色、大粉紅色。”

這件事情之是以會被如此在意,是因為按照算法,為了讓捏臉的效果更自然、精準,帶有妝容的照片一般都需要先進行檢測和還原,捏完臉之後再比對一些系統的妝容。

是以,要讓系統自動實作這個過程,工程師在編寫算法的時候自然也需要對女生妝容的效果有一些基本的了解,比如高光、陰影、眉毛的造型、腮紅的款式、霧面感、亂神感等等。

“事情鬧出了笑話,是以我們後面就真的去B站、各種短視訊上學習化妝。”神秀說道:“看了之後才知道,原來化妝還有這麼多步驟,什麼眼影、腮紅、遮瑕、陰影等等,我們從中也了解到許多神奇的知識。”

“我會在B站上看一些仿妝,像之前很火的範冰冰仿妝。”同為捏臉師的晚豐說道:“算不上系統的學習,就是會關注、了解,然後發展成為一個業餘愛好,了解這些之後,起碼和女朋友聊到化妝話題的時候就不會再接不上話了。”

“現在我們比之前好多了,起碼不會再将化妝和塗口紅劃上等号,看到一些妝容也能大概能知道她可能塗了什麼。”神秀說道。

除了化妝,從事這份工作之後,對人的了解也會加深入。晚豐告訴商業資料派,因為捏臉經常會了解一些人的面部結構,比如中庭長短、三庭五眼之類的。工作久了之後,個人審美也會提升一些。

晚豐提到,他是2020年初進入這個崗位,至今已經快兩年了。和一些科班出身的同僚不同,晚豐在學校的專業是自動化,後來一直做視覺AI相關的工作。進入智能捏臉這個項目,除了團隊内部機緣巧合之外,更大程度也在于自己的興趣。

我是AI工程師,卻在豬廠做“美容”

日常休息的時候,晚豐也會去遊戲中體驗自己開發的系統,捏一些的自己喜歡的角色。當一個喜歡的二次元形象通過自己開發的系統逐漸變得鮮活的時候,就會感受到一種特别喜悅。

“而且通過我們開發的算法,讓更多地人都能夠感受到開心的時候,其實是很自豪的。”晚豐告訴商業資料派,捏臉和其他産品不同,這份工作直接服務于使用者,能夠和使用者直接交流,能夠給玩家帶來快樂,這本身就是一件很酷的事情。

捏臉,也是在捏世界

此前,捏臉最主要應用在遊戲的世界,但元宇宙的來臨,讓虛拟形象有了更多用武之地。

在2020年,由于新冠疫情在全球範圍的影響,線上會議、活動、交流變得越來越尋常,捏臉技術曾經有限的使用場景也開始迎來了改變的契機。

這其中,一個非常重要的時間是2020年7月24日,在一個名叫動物森友會的遊戲中,一場世界頂級的學術會議正在準備開始。

雖然是在遊戲世界,但主持人仍然鄭重地表示:“很抱歉這場活動出現了一些延遲,但現在我很高興地宣布 ACAI 2020 Workshop 正式開始。”

我是AI工程師,卻在豬廠做“美容”

(圖:第二屆國際分布式人工智能學術會議)

作為世界頂級的學術會議,ACAI 2020 Workshop 在遊戲世界舉辦打開了虛拟世界舉辦嚴肅會議的大門。

這一年,作為第二屆國際分布式人工智能學術會議(DAI2020)的主辦方,南京大學也面臨線下疫情的困擾。

南京大學老師找到網易,提出想将活動搬到線上舉辦的想法,雙方由此一拍即合。于是,依托最早一個版本的瑤台,DAI2020搬到了線上舉辦。

于是,300餘位AI領域學者在網易遊戲《逆水寒》中參與了DAI2020大會,學者們上傳照片就可以實作自動AI捏臉,讓線上的學術會議也有了線下的真實感。

“除了外部的需求,公司内部也有許多會議的需求,比如公司年會、招聘,以及一些遠端的讨論會等等。”神秀告訴商業資料派。

“我們後來在遊戲捏臉基礎上還做了一版疊代,在不依賴遊戲捏臉系統本身的情況下去實作一個完全重建的遊戲捏臉算法。這一次嘗試,也讓我們得以解鎖捏臉在更多場景的應用,比如網易沉浸式活動平台瑤台就是這套算法的落地。”

今年12月網易雲音樂在港交所上市,其中線上部分就是在瑤台中進行的。2000年29歲的丁磊和2021年50歲的丁磊,與線下真實的丁磊同時敲下上市的銅鑼,實作了三個“丁磊”跨時空對話的奇特場景。

我是AI工程師,卻在豬廠做“美容”

(圖:網易雲音樂上市敲鐘)

顯然,從動森中的ACAI 2020 Workshop到網易雲音樂的敲鐘,再到近期百度釋出“希壤”,越來越多活動開始選擇在虛拟平台中舉辦,而捏臉成為人們在虛拟世界中建立認知,獲得真實感的第一步。

“在不同的場景中,我們會希望表現出不同地形象。”從遊戲到國際會議,關于不同場景下的捏臉應用,伏羲捏臉的産品經理楚涵也有自己思考。

“比如社交、化裝舞會、party,我們會需要一些有趣的形象,但在嚴肅性的會議,我們的形象一定是和真人1:1或者百分之八九十相近的,這樣能讓參會的使用者更有沉浸感。”

如今,随着元宇宙的概念越來越火,捏臉也在更多地場景中被市場和行業所重視。

我是AI工程師,卻在豬廠做“美容”

“我了解的元宇宙,就是網際網路從2D到3D的過程。”神秀和我們談到:“現在的網際網路更多傳遞的是一個2D的資料,2D的文本、2D的視訊,是以我們在社交媒體上的形象是通過頭像來展示的。但進入元宇宙之後,我們身處在内容當中,成為内容的一部分,也會需要一個3D的形象來作為自己的“頭像”,而捏臉技術恰恰就能提供這樣的服務。”

可以說,捏臉技術已經成為了建構元宇宙的基礎技術之一。而作為捏臉技術的重要應用,虛拟會議平台也正在拓展更多樣化的應用場景。

“現階段瑤台辦了許多的線上會議,但未來我們并不想将它局限成一個線上會議系統,期望它能夠給人們的生活帶來更多的改變。”網易伏羲技術負責人木白說道。

“未來,我們可能會嘗試更多地線上活動,包括展會系統、電影院、教室、婚慶等場景等等,讓更多人通過虛拟平台體驗到更便捷、更有趣、更有儀式感的生活。”

再回過頭來看,捏臉技術從萌芽到發展,參與其中的從業者們不僅自己因為捏臉而改變,同時因為他們捏的“臉”,整個世界也在發生悄然的變化。

對于這些平日裡隐藏在寫字樓高大的落地玻璃,或者格子間背後的人工智能工程師來說,他們是在捏臉,同時也塑造着這個世界。

*文中名字均為網易花名

繼續閱讀