天天看點

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

郭一璞 問耕 發自 凹非寺

量子位 報道

誰說AI隻能搞一些一本正經的工作?

谷歌最近就放出了幾隻比較搞笑的AI,可以完成一些不走尋常路的工作,比如:幫你實作靠臉吃飯,讓你說的跟唱的一樣~

是謂:谷歌AI的七個“不正經”玩法。

每個我都能玩一整天~

玩法1:跳着舞就把琴彈了

正常人彈琴,都是乖乖的坐在鋼琴前按鍵盤,或是以演奏姿勢抱着吉他、手風琴彈。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

但是谷歌這個名叫Body Synth的項目不一樣,是讓你在電腦前,以手為鍵,以腿為弦,手舞足蹈,自己彈自己。

先看一下效果,請欣賞由量子位帶來的谷歌AI樂器獨奏:《和弦》

其中的原理很簡單,打開攝像頭,自動開啟人體姿态識别,四肢和腦袋分别對應不同的音調。

隻要監測到身體某個部分有動作,就可以發出對應的音調。

跟我念,

1~2~3~4~5~6~7~

do re mi fa so la si~

以預設的C大調為例,搖頭晃腦,發出的就是so的聲音。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

動動左手,就是mi。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

動動右手,就是do。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

動動右腿,就是低音so。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

動動左腿,就是低音do。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

即使轉身背對鏡頭,也是一樣可用。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

另外,你還可以設定音色音調。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

或者打開語音控制開關,預設的音色是吉他,喊一聲strings,就可以變成管弦樂,喊一聲drums,就可以變成鼓點。

玩法2-5:靠臉吃飯

除了“靠四肢彈琴”,還可以“靠臉吃飯”。

當然,不是真的靠臉吃飯的意思,而是你可以用臉來完成一系列工作(混口飯吃)。

比如說,依靠Sound Canvas工具,你就可以用臉來畫畫或者寫字。

打開Sound Canvas之後,預設是用鍵鼠來畫畫。

這太低級了,簡直是windows 98自帶畫圖程式的水準。

是以,需要先把Tracking改一下,選中Body,就可以打開攝像頭,用臉畫畫了。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

此時,你臉的朝向就是螢幕上畫筆的位置,慢慢移動自己的腦袋,微微轉頭,就可以在螢幕上勾勒線條。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

比如,寫“量子位”三個字。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

人呀,一旦發現了臉的用途,就開始開發新工具。

除了寫字,還可以彈琴。

Keyboard就是用來彈琴的。和用臉寫字的操作差不多,臉的朝向就是小圓點在螢幕上的位置,操控小圓點敲擊螢幕上的琴鍵,就可以發出對應的聲音。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

和前面的“跳舞彈琴”一樣,Keyboard上也可以選擇不同的音色音調,如果你覺得隻有5個音不夠發揮的話,可以設定到最多15個琴鍵,兩個八度足夠演奏很多音樂了。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

當然,兩個八度的話,琴鍵太窄了,臉太大不好操作,可以切換回滑鼠操作……

熟悉了之後,還可以玩Clarion Lite,雖然也是一個用臉彈琴的項目,不過做了幾種不同的花樣。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

螢幕上的每個彩色區域都應對這一個音調,同樣用臉把小圓點放上去即可觸發,搖頭晃腦,樂聲出現。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

但是,演奏樂曲對音樂知識還是有一點要求的,有沒有小白即刻上手(上臉)的操作?

沒問題,谷歌還準備了“用臉當DJ”的Sampler項目,包含鼓點、吉他、号角、古鋼琴四段簡短的音樂,隻要用臉控制小圓點移動上去,就開始自動播放。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

現在,請欣賞下一個節目,由量子位為大家演奏《靠臉吃飯的音樂家》。

(中間有一段大家熟悉的歌,聽出來的朋友評論區見)

玩法6:說的跟唱的一樣

我有個同僚,就是雷軍的粉絲,不是米粉,單純就是B站鬼畜區知名歌手雷布斯的粉絲。

鬼畜簡單來說,就是通過調音,把一句話變成歌聲~B站上個個都是人才,但對于普通人來說,這種操作還是很難。

不妨試試這個Word Synth吧~

你隻要輸入一些單詞,然後就能按照自己的喜好調節旋律,探索不同的聲音、聲調的組合,嘗試建構鬼畜一般的歌聲。

我們嘗試了一下,限于隻能放三個視訊,這裡就用一個動圖和一個音頻呈現了:

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

這個項目背後,主要應用了谷歌雲的文字轉語音API,它靠DeepMind開發的WaveNet來合成你聽到的這些聲音。

玩法7:用聲音畫畫

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

這其實是一個音樂可視化的工具。

所謂的音樂,既包括人聲也包括多種樂器。你可以打開麥克風自己哼唱,也能調用内置的聲音看看效果。

所有輸入的聲音,能夠以不同的模式呈現,比方Hilbert Scope以及Spectrogram,能夠顯示出聲音的細緻紋理和旋律的形狀。

據一位聾人音樂家表示,這個工具還能更好的幫助他們在聽不到或者聽不清聲音的情況下,更好的學習歌唱。

正經揭秘

但,谷歌搞出這麼多奇妙的功能,并不是隻想讓你玩一天而已。

所有以上這些,是一個被稱為Creatability的項目,旨在探索如何通過網絡和AI技術,讓更多人能夠釋放自己的創造力。

紐約大學的Claire Kearney-Volpe,曾經作為藝術治療師遇到過各行各業的人,她認為每個人都能從參與創作的過程中受益。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

例如通過畫畫、制作音樂等方式,幫助患有自閉症的中學生;借助不同的技術手段,為盲人建構工具以完成晚宴的規劃和設計。

正是秉持着同樣的目的,她和谷歌團隊、無障礙社群的夥伴合作,共同搞出了Creatability項目。

在這個項目的幫助下,即便你聽不見,也能參與音樂創作。即便你行動不便,可以對着螢幕動動手指或者腦袋,也能感受到音樂的魅力。

在谷歌的宣傳片中,行動不便人士的笑容真的很燦爛。

谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門
谷歌AI的七個“不正經”玩法,個個能玩一整天玩法1:跳着舞就把琴彈了 玩法2-5:靠臉吃飯玩法6:說的跟唱的一樣玩法7:用聲音畫畫 正經揭秘傳送門

這一項目背後的AI動力,主要是谷歌的TensorFlow.js等工具,讓機器學習技術能夠在浏覽器中實作。

無論你是老師、學生、研究人員還是藝術家,都可以參與其中。你可以玩,也可以利用相關技術,開發并送出自己創造的項目。

當然前提是你還得有科學的方法才能通路~

傳送門

這些項目的官網:

g.co/creatability

GitHub:

https://github.com/googlecreativelab/creatability-components

— 完 —