[TOC]
开始前的BB
我发现 很多都是上来直接撸,撸完了发现其实还是什么都不会,自己知道ffmpeg有什么自带的东西可以参考的也不了解,那还搞个?,,脑海中没有大体的认知,很容易就迷失在细节里无法自拔,只知其术不知其道理,紧接着下一个阶段就是找大佬萌新三连
不要慌
这篇文章主要就是给大家一个大体的认知,来认识FFmpeg这个框架,由表及里,由浅入深,解开她神秘的面纱
FFmpeg框架的结构
祖传ffmpeg结构图镇楼
其中 ffplay ffmpeg ffprobe 这三个是ffmpeg里面的能编译为可执行文件的三个功能很强大的东西,这个在我们上面下载的动态库/静态库文件里的
- ffplay: ffplay是一个非常经典的播放器实现,对于做播放器的朋友,写播放器的时候一定要要去参考,像ijkplayer 就是基于ffplay,同步等地方改动的很少,大部分改动都在显示的部分,主要是实现了解码后的yuv数据上传到opengles,以及封装音频播放的接口(AudioTrack)等。
- ffmpeg: ffmpeg这个工具里面包含了很多功能,像轨道提取,视频裁剪,转码、水印、滤镜等功能
- ffprobe: ffprobe是一个查看视频格式信息的工具,包括封装信息、视频信息、音频信息等
以上三个工具我们下章讲他一些常用的命令。
底层支撑库简介
除了这三个工具类外,底层的组成部分有以下几个:
avutil
avutil
核心的工具库;其他的模块都会依赖这个库,定义了一些常用的枚举,工具类(加解密、时间、日志,FIFO队列、内存分配、大小端转换等)
avformat
avformat
协议与格式库; 这个模块封装了Protocol、Demuxer、Muxer层,是ffmpeg最重要的模块之一,相当于Android中的
MediaExtracotor
avcodec
avcodec
编解码库;封装了Codec,该模块内置很多解码器,在自己的注册列表中,一些有自己的License的第三方Codec,比如X264.fdk-aac等都可以通过插件的方式添加进来
avfilter
avfilter
音视频滤镜库;提供了很多音频与视频特效处理,可以在编解码过程中直接调用该模块为音视频数据做特效处理,这个处理是利用CPU进行处理的,音频的处理一般都是比较快,影响不是特别的大 视频的处理的,,效率是没有利用OpenGL通过GPU进行处理快
avdevice
avdevice
输入输出设备库; 比如,需要编译出播放声音或者视频的ffplay,就需要确保此模块是打开状态,同时也需要SDL库的预编译,这个设备模块的播放声音与播放视频使用的都是SDL库,也包含了其他的输入/输出设备
swresample
swresample
音频冲采样模块;可以对数字音频进行声道数、采样率、位宽等多种基本信息的转换,比如将SimpleForamt为
AV_SAMPLE_FMT_FLTP
转换为
AV_SAMPLE_FMT_S16P
格式的
swscale
swscale
图像数据格式转换模块; 比如可以将YUV数据转换为RGB数据,尺寸从1920 * 1080 缩放为 800 * 480
postproc
postproc
avfilter的处理会依赖该模块的一些函数
常用数据结构
-
封装格式上下文结构体,保存了视频文件封装格式相关信息AVFormatContext
-
demuxer结构体,每一种封装格式对应一个该结构体(FLV MKV MP4 AVI)AVInputFormat
对应muxerAVOutpuFormat
-
媒体文件中每个视频/音频流对应一个该结构体AVStream
-
编解码器上下文结构,保存了饮品是编解码相关的信息AVCodecContext
-
每个视频/音频编解码器对应一个结构体AVCodec
-
储存街凤凰后的一帧压缩编码数据AVPacket
-
储存一阵解码后的像素/采样数据AVFrame
常用核心函数
主要讲
avformat
和
avcodc
两个库的比较重要的函数
avformat
-
注册网络,初始化网络库以及网络加密协议相关的库 (openssl)avformat_network_init()
-
负责申请一个avformat_alloc_context()
结构的内存,并进行简单的初始化AvFormatContext
-
释放该结构体里的所有东西,以及他本身 ,通常与avforamt_free_context()
成对出现avformat_alloc_context()
-
关闭解复用器,关闭后就不需要调用avformat_close_input()
进行释放,因为他内部会调用avforamt_free_context()
方法进行释放avformat_free_context()
-
打开输入文件avformat_open_input()
-
获取视频文件信息avformat_find_stream_info()
-
读取音视频包AVPacketav_read_frame()
-
通过文件字节进行Seekavformat_seek_file()
-
可以通过相应的格式选择Seek到关键帧还是指定帧以及字节av_seek_frame()
解复用的调用流程如下
- 分配一个AVFormatContext的上下文
- 打开视频文件
- 寻找到对应的流信息
- 循环读取流/或者在中间seek到指定的位置
- 结束读取,关闭流,释放空间
更详细的代码会在后面的章节中有示例代码
avcodec
-
分配解码器的上下文avcodec_alloc_context3()
-
根据Id查找解码器avcodec_find_decoder()
-
根据解码器名字查找解码器avcodec_find_decoder_by_name()
-
打开编解码器avcodec_open2()
-
发送解封装后的数据包avcodec_send_packet()
-
接受解码后的数据avcodec_recive_frame()
-
释放解码器上下文avcodec_free_context()
-
关闭解码器avcodec_close()
解码器的调用流程如下
- 分配一个AVCodecContext
- 将AVStream里的Codec的参数传递到AVCodecContext
- 根据Id或者名字寻找的相应的解码器
- 打开解码器
- 发送AVPacket(解封装的数据) ---> 接受到解码后的数据(YUV/PCM)
- 关闭解码器,释放AVCodecContext
关于FFmpeg的核心的结构体与函数,以及相应的解复用/解码的流程先了解这么多,有个大概的印象,我们在后面的文章里,就会慢慢体会到他们带来的无穷快感
一袋米要抗几楼 (痛みを感じるようにしましょう) 的佩恩警告⚠️ (づ。◕‿‿◕。)づ
未完持续。。。
转载于:https://juejin.im/post/5cad71926fb9a068b7489db5