天天看點

Qt音視訊開發35-左右通道音量計算和音量不同範圍值的轉換

作者:Qt自定義控件

一、前言

視訊檔案一般會有兩個聲音通道及左右聲道,值有時候一樣有時候不一樣,很多場景下我們需要對其分開計算不同的音量值,在QAudioFormat中可以擷取具體有幾個通道,如果是一個通道,則左右通道值設定一樣,計算通道的音量值一般是對所有音量資料轉換後累加後進行一個換算即可,在Qt的示例中就提供了這個計算規則。

視訊播放過程中,需要對音量大小進行控制,但是音量大小的範圍值,在不同的第三方庫或者元件中約定是不一樣的,比如正常的有0-1/0-100/0-255、特殊的有-100到100/0-65535之類的,作為通用的元件,就需要将這些範圍值轉換,比如範圍值是0-255音量值130,需要轉換到0-100範圍值的對應音量值應該是50。同理擷取音量值也是這個道理,源頭擷取到的音量值需要轉換成通用約定的範圍值的音量值,再設定到界面上的音量條,這個轉換有個通用的标準公式,(((舊值 - 舊最小值) * (新最大值 - 新最小值)) / (舊最大值 - 舊最小值)) + 新最小值,通過這個公式就可以拿到轉換後的新值。

音量值的變化按照正常的了解是固定的間隔,比如音量50就是50,音量越大聲音就大,小就小,還有個新的方式就是線性變化,聲音越小就音量幅度變化小,越大則變化幅度越大,有個幅度的趨勢。大概從Qt5.8版本開始提供了這個功能,QAudio::convertVolume可以将一個聲音值指定轉換幅度轉換到最終的音量。

二、效果圖

Qt音視訊開發35-左右通道音量計算和音量不同範圍值的轉換

三、體驗位址

  1. 國内站點:https://gitee.com/feiyangqingyun
  2. 國際站點:https://github.com/feiyangqingyun
  3. 個人作品:https://blog.csdn.net/feiyangqingyun/article/details/97565652
  4. 體驗位址:https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼:01jf 檔案名:bin_video_demo/bin_linux_video。

四、相關代碼

bool AudioHelper::getAudioLevel(QAudioFormat format, const char *data, qint64 len, qreal &leftLevel, qreal &rightLevel)
{
    leftLevel = rightLevel = 0;
    quint32 maxAmplitude = getMaxAmplitude(format);
    if (!maxAmplitude) {
        return false;
    }

    quint32 leftValue = 0;
    quint32 rightValue = 0;
    int sampleSize = getSampleSize(format);
    int channelCount = format.channelCount();
    int channelBytes = sampleSize / 8;
    int sampleBytes = channelCount * channelBytes;
    int numSamples = len / sampleBytes;
    const uchar *ptr = reinterpret_cast<const uchar *>(data);
    //qDebug() << sampleSize << channelCount << numSamples;

    for (int i = 0; i < numSamples; ++i) {
        for (int j = 0; j < channelCount; ++j) {
            quint32 value = 0;
            if (sampleSize == 8) {
                value = *reinterpret_cast<const quint8 *>(ptr);
            } else if (sampleSize == 16) {
                value = qAbs(qFromLittleEndian<qint16>(ptr));
            } else if (sampleSize == 32) {
                value = qAbs(qFromLittleEndian<qint32>(ptr));
            }

            //分左右通道
            if (j == 0) {
                leftValue = qMax(value, leftValue);
            } else {
                rightValue = qMax(value, rightValue);
            }

            ptr += channelBytes;
        }
    }

    leftValue = qMin(leftValue, maxAmplitude);
    rightValue = qMin(rightValue, maxAmplitude);
    leftLevel = qreal(leftValue) / maxAmplitude;
    rightLevel = qreal(rightValue) / maxAmplitude;
    if (sampleSize == 8) {
        leftLevel -= 0.5;
        rightLevel -= 0.5;
    }

    //單通道則右通道的值強制和左通道相等
    if (channelCount == 1) {
        rightLevel = leftLevel;
    }

    //qDebug() << TIMEMS << leftValue << leftLevel << rightValue << rightLevel;
    return true;
}

int VideoHelper::getRangeValue(int oldMin, int oldMax, int oldValue, int newMin, int newMax)
{
    return (((oldValue - oldMin) * (newMax - newMin)) / (oldMax - oldMin)) + newMin;
}

int EasyPlayerThread::getVolume()
{
    //聲音範圍是[-182, 73] 需要轉換成[0, 100]
    int volume = 0;
    if (easyPlayer) {
        EasyPlayerPro_Getparam(easyPlayer, EASY_PARAM_AUDIO_VOLUME, &volume);
        volume = VideoHelper::getRangeValue(-182, 73, volume, 0, 100);
    }
    return volume;
}

void EasyPlayerThread::setVolume(int volume)
{
    emit receiveVolume(volume);
    if (easyPlayer) {
        volume = VideoHelper::getRangeValue(0, 100, volume, -182, 73);
        EasyPlayerPro_Setparam(easyPlayer, EASY_PARAM_AUDIO_VOLUME, &volume);
    }
}

int HaiKangThread::getVolume()
{
    //聲音範圍是[0, 65535] 需要轉換成[0, 100]
    int volume = 100;
    if (port >= 0) {
        volume = PlayM4_GetVolume(port);
        volume = VideoHelper::getRangeValue(0, 65535, volume, 0, 100);
    }
    return volume;
}

void HaiKangThread::setVolume(int volume)
{
    emit receiveVolume(volume);
    volume = VideoHelper::getRangeValue(0, 100, volume, 0, 65535);
    if (hwnd >= 0) {
        //海康很操蛋預設聲音關閉的需要主動開啟
        if (!openSound) {
            openSound = true;
            NET_DVR_OpenSoundShare(hwnd);
        }

        NET_DVR_Volume(hwnd, volume);
    }

    if (port >= 0) {
        PlayM4_SetVolume(port, volume);
    }
}           

五、功能特點

5.1 基礎功能

  1. 支援各種音頻視訊檔案格式,比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
  2. 支援本地攝像頭裝置,可指定分辨率、幀率。
  3. 支援各種視訊流格式,比如rtp、rtsp、rtmp、http等。
  4. 本地音視訊檔案和網絡音視訊檔案,自動識别檔案長度、播放進度、音量大小、靜音狀态等。
  5. 檔案可以指定播放位置、調節音量大小、設定靜音狀态等。
  6. 支援倍速播放檔案,可選0.5倍、1.0倍、2.5倍、5.0倍等速度,相當于慢放和快放。
  7. 支援開始播放、停止播放、暫停播放、繼續播放。
  8. 支援抓拍截圖,可指定檔案路徑,可選抓拍完成是否自動顯示預覽。
  9. 支援錄像存儲,手動開始錄像、停止錄像,部分核心支援暫停錄像後繼續錄像,跳過不需要錄像的部分。
  10. 支援無感覺切換循環播放、自動重連等機制。
  11. 提供播放成功、播放完成、收到解碼圖檔、收到抓拍圖檔、視訊尺寸變化、錄像狀态變化等信号。
  12. 多線程處理,一個解碼一個線程,不卡主界面。

5.2 特色功能

  1. 同時支援多種解碼核心,包括qmedia核心(Qt4/Qt5/Qt6)、ffmpeg核心(ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5)、vlc核心(vlc2/vlc3)、mpv核心(mpv1/mp2)、海康sdk、easyplayer核心等。
  2. 非常完善的多重基類設計,新增一種解碼核心隻需要實作極少的代碼量,就可以應用整套機制。
  3. 同時支援多種畫面顯示政策,自動調整(原始分辨率小于顯示控件尺寸則按照原始分辨率大小顯示,否則等比例縮放)、等比例縮放(永遠等比例縮放)、拉伸填充(永遠拉伸填充)。所有核心和所有視訊顯示模式下都支援三種畫面顯示政策。
  4. 同時支援多種視訊顯示模式,句柄模式(傳入控件句柄交給對方繪制控制)、繪制模式(回調拿到資料後轉成QImage用QPainter繪制)、GPU模式(回調拿到資料後轉成yuv用QOpenglWidget繪制)。
  5. 支援多種硬體加速類型,ffmpeg可選dxva2、d3d11va等,mpv可選auto、dxva2、d3d11va,vlc可選any、dxva2、d3d11va。不同的系統環境有不同的類型選擇,比如linux系統有vaapi、vdpau,macos系統有videotoolbox。
  6. 解碼線程和顯示窗體分離,可指定任意解碼核心挂載到任意顯示窗體,動态切換。
  7. 支援共享解碼線程,預設開啟并且自動處理,當識别到相同的視訊位址,共享一個解碼線程,在網絡視訊環境中可以大大節約網絡流量以及對方裝置的推流壓力。國内頂尖視訊廠商均采用此政策。這樣隻要拉一路視訊流就可以共享到幾十個幾百個通道展示。
  8. 自動識别視訊旋轉角度并繪制,比如手機上拍攝的視訊一般是旋轉了90度的,播放的時候要自動旋轉處理,不然預設是倒着的。
  9. 自動識别視訊流播放過程中分辨率的變化,在視訊控件上自動調整尺寸。比如錄影機可以在使用過程中動态配置分辨率,當分辨率改動後對應視訊控件也要做出同步反應。
  10. 音視訊檔案無感覺自動切換循環播放,不會出現切換期間黑屏等肉眼可見的切換痕迹。
  11. 視訊控件同時支援任意解碼核心、任意畫面顯示政策、任意視訊顯示模式。
  12. 視訊控件懸浮條同時支援句柄、繪制、GPU三種模式,非絕對坐标移來移去。
  13. 本地攝像頭裝置支援指定裝置名稱、分辨率、幀率進行播放。
  14. 錄像檔案同時支援打開的視訊檔案、本地攝像頭、網絡視訊流等。
  15. 瞬間響應打開和關閉,無論是打開不存在的視訊或者網絡流,探測裝置是否存在,讀取中的逾時等待,收到關閉指令立即中斷之前的操作并響應。
  16. 支援打開各種圖檔檔案,支援本地音視訊檔案拖曳播放。
  17. 視訊控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視訊等功能。
  18. 音頻元件支援聲音波形值資料解析,可以根據該值繪制波形曲線和柱狀聲音條,預設提供了聲音振幅信号。
  19. 各元件中極其詳細的列印資訊提示,尤其是報錯資訊提示,封裝的統一列印格式。針對現場複雜的裝置環境測試極其友善有用,相當于精确定位到具體哪個通道哪個步驟出錯。
  20. 代碼架構和結構優化到最優,性能強悍,持續疊代更新更新。
  21. 源碼支援Qt4、Qt5、Qt6,相容所有版本。

5.3 視訊控件

  1. 可動态添加任意多個osd标簽資訊,标簽資訊包括名字、是否可見、字号大小、文本文字、文本顔色、标簽圖檔、标簽坐标、标簽格式(文本、日期、時間、日期時間、圖檔)、标簽位置(左上角、左下角、右上角、右下角、居中、自定義坐标)。
  2. 可動态添加任意多個圖形資訊,這個非常有用,比如人工智能算法解析後的圖形區域資訊直接發給視訊控件即可。圖形資訊支援任意形狀,直接繪制在原始圖檔上,采用絕對坐标。
  3. 圖形資訊包括名字、邊框大小、邊框顔色、背景顔色、矩形區域、路徑集合、點坐标集合等。
  4. 每個圖形資訊都可指定三種區域中的一種或者多種,指定了的都會繪制。
  5. 内置懸浮條控件,懸浮條位置支援頂部、底部、左側、右側。
  6. 懸浮條控件參數包括邊距、間距、背景透明度、背景顔色、文本顔色、按下顔色、位置、按鈕圖示代碼集合、按鈕名稱辨別集合、按鈕提示資訊集合。
  7. 懸浮條控件一排工具按鈕可自定義,通過結構體參數設定,圖示可選圖形字型還是自定義圖檔。
  8. 懸浮條按鈕内部實作了錄像切換、抓拍截圖、靜音切換、關閉視訊等功能,也可以自行在源碼中增加自己對應的功能。
  9. 懸浮條按鈕對應實作了功能的按鈕,有對應圖示切換處理,比如錄像按鈕按下後會切換到正在錄像中的圖示,聲音按鈕切換後變成靜音圖示,再次切換還原。
  10. 懸浮條按鈕單擊後都用名稱唯一辨別作為信号發出,可以自行關聯響應處理。
  11. 懸浮條空白區域可以顯示提示資訊,預設顯示目前視訊分辨率大小,可以增加幀率、碼流大小等資訊。
  12. 視訊控件參數包括邊框大小、邊框顔色、焦點顔色、背景顔色(預設透明)、文字顔色(預設全局文字顔色)、填充顔色(視訊外的空白處填充黑色)、背景文字、背景圖檔(如果設定了圖檔優先取圖檔)、是否拷貝圖檔、縮放顯示模式(自動調整、等比例縮放、拉伸填充)、視訊顯示模式(句柄、繪制、GPU)、啟用懸浮條、懸浮條尺寸(橫向為高度、縱向為寬度)、懸浮條位置(頂部、底部、左側、右側)。

繼續閱讀