使用.NET Core搭建分布式音頻效果處理服務（一）需求、問題和解決方案的幾個坑

2018-08-13 23:50:00

最近公司需要在伺服器上實作兩個音頻的合成及效果處理。

哇，乍一聽功能很簡單吧，就是将兩個音頻疊加，随便一個媒體處理軟體幾秒鐘即可完成，但這僅僅隻是針對單使用者而言而已。其次，本來這種服務原本就不應該在伺服器上面實作，為何？

如果在C/S模式下，完全可以采用client原生的在客戶機上面進行流資料媒體處理，再将處理後的檔案上傳到指定的雲存儲位置（比如阿裡雲的OSS），這樣對于伺服器來說0壓力，隻是做個中間資料傳遞即可。一切就那麼簡單，不存在大并發問題，不存在擴充性問題，可兩個關鍵問題又來了：

如果所有互動裝置都使用統一的流媒體處理庫進行處理（比如ffmpeg），那麼，最終得到的效果檔案将必定是一樣的，可目前關鍵是目前IOS小組和ANDROID小組參數一樣，得到的效果卻完全不一樣，IOS上有很明顯的電流聲和雜音（如果有高手指點一下，鄙人非常感謝，嘿嘿）。
在原生的軟體（APP）上調用ffmpeg是可行的，在網頁上怎麼辦？畢竟目前網頁也可以實作錄音的功能，比如微信API、 Recorder.js ，使用者需要将自己的錄制的聲音進行一些效果處理的時候，那麼網頁将是無能為力的。

如上的最終效果不一緻、平台功能沒有100%覆寫問題，将又是這個産品實際的最大隐患，一緻性和通用性并不隻是針對技術要求，使用者在産品的回報上同樣也需要一緻性和通用性。是以，這樣就需要伺服器來統一處理這類功能需求和問題，如下幾點優勢（僅針對這個項目而言）：

純粹的點對點C/S模式，這裡就不畫圖了，下一節我們開始慢慢的畫餅o(∩_∩)o 哈哈。

感謝閱讀

繼續閱讀