0%

上篇我们停留在概念上的,现在动手写写代码。

OpenGL官网我们可以看到这么一段话:

macOS
Unlike other platforms, where the Operating System and OpenGL implementations are often updated separately, OpenGL updates are included as part of macOS system updates. To obtain the latest OpenGL on macOS, users should upgrade to the latest OS release, which can be found at Apple.com.

换句话来说OpenGL已经集成在我们的Mac系统中,但是我们还需要一些执行窗口任务或者处理用户输入的函数,这里需要用到的库有:

安装GLEW、GLEW

1
2
3
4
5
6
7
8
9
10
11
12
13
➜  blogs brew install glfw3
Updating Homebrew...
==> Downloading https://homebrew.bintray.com/bottles/glfw-3.3.2.mojave.bottle.tar.gz
######################################################################## 100.0%
==> Pouring glfw-3.3.2.mojave.bottle.tar.gz
🍺 /usr/local/Cellar/glfw/3.3.2: 14 files, 492.8KB #安装位置
➜ blogs brew install glew
Updating Homebrew...
==> Downloading https://homebrew.bintray.com/bottles/glew-2.1.0_1.mojave.bottle.tar.gz
==> Downloading from https://akamai.bintray.com/66/66638564b5b9d2d915b97841ef1cc117f701c7ec34707734fa1ce11919c28
######################################################################## 100.0%
==> Pouring glew-2.1.0_1.mojave.bottle.tar.gz
🍺 /usr/local/Cellar/glew/2.1.0_1: 38 files, 3MB #安装位置

在Xcode配置GLEW、GLEW

opengl2-xcode1.png

opengl2-xcode2.png

opengl2-xcode3.png

opengl2-xcode4.png

opengl2-xcode5.png

opengl2-xcode6.png

添加两个dylib文件的方法时,没有在framework中搜索到这两个文件时,点击add other,然后点击shift+command+G进入/usr/local文件夹对应的安装路径找。

下载GLAD库

glad1.png

glad2.png

1
2
3
4
5
6
7
8
9
10
11
12
13
➜  ~ cd /Users/samtake/Downloads/glad 
➜ glad ls
include src
➜ glad alias tree="find . -print | sed -e 's;[^/]*/;|____;g;s;____|; |;g'"
➜ glad tree
|____include
| |____KHR
| | |____khrplatform.h
| |____glad
| | |____glad.h
|____src
| |____glad.c
➜ glad

将include文件夹中的两个文件复制到/usr/local/include内,然后添加glad.c文件到XCode工程中.

demo

复制源码代替原有的main.cpp文件,build一下编译通过即可。

demo.png

demo源码

opengl-book.jpeg

啃书了!这本书买了很久都没看完,也忘的差不多了。现在试着用简洁的语言记录学习过程。

什么是OpenGL?

OpenGL是一种可以对图形进行访问的软件库。它的接口与硬件无关,自身不包含任何执行窗口任务或者处理用户输入的函数(这些操作我们需要系统提供的接口来实现)。

通过OpenGL渲染图像的主要操作(详细参考:渲染管线流程)

  • 设置数据,构建形状
  • 着色器
  • 光栅栏化,产生每个片元
  • 执行片元着色器

基本概念

光栅化(rasterization)将输入图元的数学描述转换为与屏幕位置对应的像素片元。
渲染(render)计算机从模型创建到最终图像的过程。
像素(pixel)显示器上最小的可见单元。

着色器(shader)专为图形处理单元编译的一种小型程序。

  • 定点着色器(vertex shader)处理定点数据
  • 片元着色器处理光栅化的片元数据

渲染管线(rendering pipeline)OpenGL一系列数据处理过程,并且将应用程序的数据转换到最终渲染的图像。

渲染管线流程

rendering-pipeline.jpeg

通过FFmpeg源码使用脚本编译出可以在iOS下使用的SDK

具体脚本链接:FFmpeg-iOS-build-script

  • 在FFmpeg源码的上一级目录添加build-ffmpeg.sh文件
  • 命令行执行:./build-ffmpeg.sh
  • 如果无执行权限的话执行:chmod 777 ./build-ffmpeg.sh
  • 注意:打包上传到商店时使用的SDK只需要真机的

FFmpeg与SDL结合,实现多媒体播放器,内容有:多线程与锁, 锁与条件变量在实际中的应用,音视频同步,seek等。

FFmpeg-安装及基本概念
FFmpeg-命令
通过 C语言 操作FFmpeg对多媒体文件的处理

SDL简介

SDL可以对音视频进行渲染,这里主要部分有:安装SDL、使用SDL的基本步骤、SDL窗口渲染、SDL事件处理、SDL纹理渲染。

安装SDL

1
2
3
4
5
6
7
8
9
10
11
➜  ~ brew info SDl2
➜ ~ brew info SDl2
SDl2: stable 2.0.10 (bottled), HEAD
Low-level access to audio, keyboard, mouse, joystick, and graphics
https://www.libsdl.org/
/usr/local/Cellar/SDl2/2.0.10 (87 files, 4.6MB)
Poured from bottle on 2020-03-24 at 14:13:57
From: git://mirrors.ustc.edu.cn/homebrew-core.git//Formula/sdl2.rb
==> Options
--HEAD
Install HEAD version

使用SDL的基本步骤

SDL窗口渲染

SDL事件处理

SDL彻底理解纹理渲染

FFmpeg-安装及基本概念
FFmpeg-命令
FFmpeg-demo源码地址
这里记录通过 C语言 操作FFmpeg对多媒体文件的处理

Log

常用日志级别(级别由高到底排列)
1.AV_LOFG_ERROR
2.AV_LOG_WARNING
3.AV_LOG_INFO

启用步骤

1
2
3
include <libavutil/log.h>
av_log_set_level(AV_LOG_DEBUG) #只有该级别以及该级别之上的日志才会打印
av_log(NULL,AV_LOG_INFO,"hello world:%s\n","op" )
1
2
3
4
➜  FFmpeg-demo git:(master) clang -g -o ffmpeg_log ffmpeg_log.c -lavutil
➜ FFmpeg-demo git:(master) ✗ ./ffmpeg_log
hello world!
➜ FFmpeg-demo git:(master) ✗

文件的删除&重命名

avpriv_io_move("111.txt","222.txt");重命名
avpriv_io_delete("./mytestfile.txt");删除

1
2
3
➜  FFmpeg-demo git:(master) ✗ clang -g -o ffmpeg_del ffmpeg_file.c `pkg-config --libs libavformat`
➜ FFmpeg-demo git:(master) ✗ pkg-config --libs libavformat #这一命令的作用时:在系统中寻找到libavformat库所在的位置
-L/usr/local/Cellar/ffmpeg/4.2.2_2/lib -lavformat

操作目录

avio_open_dir
avio_read_dir
avio_free_directory_entry
avio_close_dir

1
2
3
av_log(NULL, AV_LOG_INFO, "%12"PRId64"%s \n",entry->size,entry->name);

# PRId64 是ffmpeg里面定义的一个宏,ffmpeg里面读取的文件也是64位的。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
➜  FFmpeg-demo git:(master) ✗ clang -g -o list ffmpeg_list.c `pkg-config --libs libavformat libavutil`
➜ FFmpeg-demo git:(master) ✗ ./list
186ffmpeg_log.c
2442build_ffmpeg_for_android.sh
4433list.c
818ffmpeg_list.c
96list.dSYM
96ffmpeg_del.dSYM
5209encode_audio.c
1051read_file.c
11151extr_video.c
11027avmerge.c
9532decode_video.c
5747cutvideo.c
8760ffmpeg_del
4265encode_video.c
8760ffmpeg_log
6500extr_audio.c
9380list
96android
1073mediainfo.c
7020decode_audio.c
541ffmpeg_file.c
5132remuxing.c
448.git
96ffmpeg_log.dSYM
803write_file.c
5066extra_audio_ffapi.c
288player

打印音视频meta信息

av_register_all
avformat_open_input
av_dump_format(fmt_ctx, 0, "./test.mp4", 0/**输入信息*/);

输入信息 填0
输入信息 填1

avformat_close_input

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
➜  FFmpeg-demo git:(master) ✗ clang -g -o mediainfo mediainfo.c `pkg-config --libs libavutil libavformat`
mediainfo.c:17:5: warning: 'av_register_all' is deprecated [-Wdeprecated-declarations]
av_register_all();
^
/usr/local/include/libavformat/avformat.h:2049:1: note: 'av_register_all' has been explicitly marked deprecated here
attribute_deprecated
^
/usr/local/include/libavutil/attributes.h:94:49: note: expanded from macro 'attribute_deprecated'
# define attribute_deprecated __attribute__((deprecated))
^
1 warning generated.
➜ FFmpeg-demo git:(master) ✗ ./mediainfo
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from './test.mp4':
Metadata:
major_brand : mp42
minor_version : 0
compatible_brands: isommp42
creation_time : 2020-03-19T07:15:55.000000Z
Duration: 00:00:55.51, start: 0.000000, bitrate: 8422 kb/s
Stream #0:0(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 380 kb/s (default)
Metadata:
creation_time : 2020-03-19T07:15:55.000000Z
handler_name : Mainconcept MP4 Sound Media Handler
Stream #0:1(eng): Video: h264 (High) (avc1 / 0x31637661), yuv420p(tv, bt709), 1280x720 [SAR 1:1 DAR 16:9], 8040 kb/s, 50 fps, 50 tbr, 50k tbn, 100 tbc (default)
Metadata:
creation_time : 2020-03-19T07:15:55.000000Z
handler_name : Mainconcept MP4 Video Media Handler
encoder : AVC Cod

抽取多媒体中的音频数据

av_init_packet(&pkt);

av_find_best_stream

av_read_frame/av_packet_unref

1
2
3
clang -g -o extr_audio  extr_audio.c `pkg-config --libs libavutil libavformat`
./extr_audio ./test.mp4 ./test.aac
ffplay test.aac

抽取多媒体中的H264视频数据

先要知道的三点:
1.将多媒体中的H264视频数据抽取后,它其实是由一帧一帧压缩后的视频帧组成的,如何区分这一帧一帧的视频帧呢?两种方法:

  • 在每一帧的长度前面加一个真的长度,当读取第一帧的时候先读取这一帧的长度,根据这一帧的长度在读取帧的数据长度,依次下去。。。
  • 在每一帧的前面加关键字(特征码),只要遇到特征码就知道这一帧开始了,上一帧结束了。

2.SPS/PPS(它只有几个字节,不会增加网络负担)
解码的视频参数,以及视频帧的宽高(也就是常说的视频分辨率),等等都是存在于SPS/PPS。

视频播放时,每次切换分辨率都要更新SPS/PPS。

而在视频直播时,在每个关键帧里面都会有一个SPS/PPS。

3.ffmpeg如何获取SPS/PPS?
codec->extradata

1
2
3
clang -g -o extr_video  extr_video.c `pkg-config --libs libavutil libavformat`
./extr_video ./test.mp4 test.h264
ffplay test.h264

mp4转flv

1
2
3
4
5
6
7
8
9
10
11
avformat_alloc_output_context2/avformat_free_context

avformat_new_stream

avcodec_parameters_copy

avformat_write_header #头

av_interleaved_write_frame #头数据

av_write_trailer #尾
1
2
3
clang -g -o remuxing  remuxing.c `pkg-config --libs  libavformat`
./remuxing ./test.mp4 test.flv
ffplay test.flv

音视频裁剪

av_seek_frame

1
2
3
clang -g -o cutvideo  cutvideo.c `pkg-config --libs  libavformat  libavcodec`
./cutvideo 10 20 ./test.mp4 cutvideo.mp4
ffplay cutvideo.mp4

FFmpeg编解码概括

类型:

  • H264解码
  • H264编码
  • AAC解码
  • AAC编码

用到的头文件:

  • libavcodec/avcodec.h

用到的结构体:

  • AVCodec编解码结构体
  • AVCodecContext 编解码器上下文
  • AVFrame 解码后的帧

结构体内存的分配和释放API:

  • av_frame_alloc/av_frame_free()
  • avcodec_alloc_context3()
  • avcodec_free_context()

解码步骤:

  • avcodec_find_decoder查找解码器
  • avcodec_open2打开解码器
  • avcodec_decode_video2解码,得到RGB或者YUV数据

H264编码

步骤:

  • avcodec_find_encoder_by_name查看编码器
  • avcodec_open2设置编码参数,并打开编码器
  • avcodec_encode_video2编码
1
2
3
4
5
➜  FFmpeg-demo git:(master) ✗ clang -g -o encode_video  encode_video.c `pkg-config --libs  libavcodec` 
➜ FFmpeg-demo git:(master) ✗ ./encode_video
Usage: ./encode_video <output file> <codec name>
➜ FFmpeg-demo git:(master) ✗ ./encode_video encode_video.h264 libx264
➜ FFmpeg-demo git:(master) ✗ ffplay encode_video.h264

视频转图片

1
2
➜  FFmpeg-demo git:(master) ✗ clang -g -o decode_video  decode_video.c `pkg-config --libs  libavformat libavutil libavcodec libswscale`
➜ FFmpeg-demo git:(master) ✗ ./decode_video ./test.mp4 ./

AAC编码

avcodec_encodec_audio2

1
2
3
clang -g -o encode_audio encode_audio.c `pkg-config --libs libavcodec`
./encode_audio encode_audio.aac
ffplay encode_audio.aac

接着FFmpeg这一篇,这里记录FFmpeg的命令。

命令分成以下几类:

  • 基本信息查询命令
  • 录制
  • 分解/复用
  • 处理原始数据
  • 滤镜
  • 切割与合并
  • 图/视互转
  • 直播相关
    除了 FFMPEG 的基本信息查询命令外,其它命令都按下图所示的流程处理音视频。

ffmpeg播放多媒体文件的流程

然后将编码的数据包传送给解码器(除非为数据流选择了流拷贝,请参阅进一步描述)。 解码器产生未压缩的帧(原始视频/ PCM音频/ …),可以通过滤波进一步处理(见下一节)。 在过滤之后,帧被传递到编码器,编码器并输出编码的数据包。 最后,这些传递给复用器,将编码的数据包写入输出文件。
默认情况下,ffmpeg只包含输入文件中每种类型(视频,音频,字幕)的一个流,并将其添加到每个输出文件中。 它根据以下标准挑选每一个的“最佳”:对于视频,它是具有最高分辨率的流,对于音频,它是具有最多channel的流,对于字幕,是第一个字幕流。 在相同类型的几个流相等的情况下,选择具有最低索引的流。
您可以通过使用-vn / -an / -sn / -dn选项来禁用某些默认设置。 要进行全面的手动控制,请使用-map选项,该选项禁用刚描述的默认设置。
下面我们就来详细介绍一下这些命令。

基本信息查询命令

基本信息查询

FFMPEG 可以使用下面的参数进行基本信息查询。例如,想查询一下现在使用的 FFMPEG 都支持哪些 filter,就可以用 ffmpeg -filters 来查询。详细参数说明如下:

参数 说明
-version 显示版本。
-formats 显示可用的格式(包括设备)。
-demuxers 显示可用的demuxers。
-muxers 显示可用的muxers。
-devices 显示可用的设备。
-codecs 显示libavcodec已知的所有编解码器。
-decoders 显示可用的解码器。
-encoders 显示所有可用的编码器。
-bsfs 显示可用的比特流filter。
-protocols 显示可用的协议。
-filters 显示可用的libavfilter过滤器。
-pix_fmts 显示可用的像素格式。
-sample_fmts 显示可用的采样格式。
-layouts 显示channel名称和标准channel布局。
-colors 显示识别的颜色名称。

命令格式与参数

接下来介绍的是 FFMPEG 处理音视频时使用的命令格式与参数。
下面是 FFMPEG 的基本命令格式:
ffmpeg [global_options] {[input_file_options] -i input_url} ...
{[output_file_options] output_url} ...

ffmpeg 通过 -i 选项读取输任意数量的输入“文件”(可以是常规文件,管道,网络流,抓取设备等,并写入任意数量的输出“文件”。

原则上,每个输入/输出“文件”都可以包含任意数量的不同类型的视频流(视频/音频/字幕/附件/数据)。 流的数量和/或类型是由容器格式来限制。 选择从哪个输入进入到哪个输出将自动完成或使用 -map 选项。
要引用选项中的输入文件,您必须使用它们的索引(从0开始)。 例如。 第一个输入文件是0,第二个输入文件是1,等等。类似地,文件内的流被它们的索引引用。 例如。 2:3是指第三个输入文件中的第四个流。
上面就是 FFMPEG 处理音视频的常用命令,下面是一些常用参数:

主要参数

参数 说明
-f fmt(输入/输出) 强制输入或输出文件格式。 格式通常是自动检测输入文件,并从输出文件的文件扩展名中猜测出来,所以在大多数情况下这个选项是不需要的。
-i url(输入) 输入文件的网址
-y(全局参数) 覆盖输出文件而不询问。
-n(全局参数) 不要覆盖输出文件,如果指定的输出文件已经存在,请立即退出。
-c [:stream_specifier] codec(输入/输出,每个流) 选择一个编码器(当在输出文件之前使用)或解码器(当在输入文件之前使用时)用于一个或多个流。codec 是解码器/编码器的名称或 copy(仅输出)以指示该流不被重新编码。如:ffmpeg -i INPUT -map 0 -c:v libx264 -c:a copy OUTPUT
-codec [:stream_specifier]编解码器(输入/输出,每个流) 同 -c-t duration(输入/输出)当用作输入选项(在-i之前)时,限制从输入文件读取的数据的持续时间。当用作输出选项时(在输出url之前),在持续时间到达持续时间之后停止输出。-ss位置(输入/输出)` 当用作输入选项时(在-i之前),在这个输入文件中寻找位置。 请注意,在大多数格式中,不可能精确搜索,因此ffmpeg将在位置之前寻找最近的搜索点。 当转码和-accurate_seek被启用时(默认),搜索点和位置之间的这个额外的分段将被解码和丢弃。 当进行流式复制或使用-noaccurate_seek时,它将被保留。当用作输出选项(在输出url之前)时,解码但丢弃输入,直到时间戳到达位置。

-frames [:stream_specifier] framecount(output,per-stream) 停止在帧计数帧之后写入流。

-filter [:stream_specifier] filtergraph(output,per-stream) 创建由filtergraph指定的过滤器图,并使用它来过滤流。filtergraph是应用于流的filtergraph的描述,并且必须具有相同类型的流的单个输入和单个输出。在过滤器图形中,输入与标签中的标签相关联,标签中的输出与标签相关联。有关filtergraph语法的更多信息,请参阅ffmpeg-filters手册。

视频参数

参数 说明
-vframes num(输出) 设置要输出的视频帧的数量。对于-frames:v,这是一个过时的别名,您应该使用它。
-r [:stream_specifier] fps(输入/输出,每个流) 设置帧率(Hz值,分数或缩写)。作为输入选项,忽略存储在文件中的任何时间戳,根据速率生成新的时间戳。这与用于-framerate选项不同(它在FFmpeg的旧版本中使用的是相同的)。如果有疑问,请使用-framerate而不是输入选项-r。作为输出选项,复制或丢弃输入帧以实现恒定输出帧频fps。
-s [:stream_specifier]大小(输入/输出,每个流) 设置窗口大小。作为输入选项,这是video_size专用选项的快捷方式,由某些分帧器识别,其帧尺寸未被存储在文件中。作为输出选项,这会将缩放视频过滤器插入到相应过滤器图形的末尾。请直接使用比例过滤器将其插入到开头或其他地方。格式是’wxh’(默认 - 与源相同)。
-aspect [:stream_specifier] 宽高比(输出,每个流) 设置方面指定的视频显示宽高比。aspect可以是浮点数字符串,也可以是num:den形式的字符串,其中num和den是宽高比的分子和分母。例如“4:3”,“16:9”,“1.3333”和“1.7777”是有效的参数值。如果与-vcodec副本一起使用,则会影响存储在容器级别的宽高比,但不会影响存储在编码帧中的宽高比(如果存在)。
-vn(输出) 禁用视频录制。
-vcodec编解码器(输出) 设置视频编解码器。这是-codec:v的别名。
-vf filtergraph(输出) 创建由filtergraph指定的过滤器图,并使用它来过滤流。

音频参数

参数 说明
-aframes(输出) 设置要输出的音频帧的数量。这是-frames:a的一个过时的别名。
-ar [:stream_specifier] freq(输入/输出,每个流) 设置音频采样频率。对于输出流,它默认设置为相应输入流的频率。对于输入流,此选项仅适用于音频捕获设备和原始分路器,并映射到相应的分路器选件。
-ac [:stream_specifier]通道(输入/输出,每个流) 设置音频通道的数量。对于输出流,它默认设置为输入音频通道的数量。对于输入流,此选项仅适用于音频捕获设备和原始分路器,并映射到相应的分路器选件。
-an(输出) 禁用录音。
-acodec编解码器(输入/输出) 设置音频编解码器。这是-codec的别名:a。
-sample_fmt [:stream_specifier] sample_fmt(输出,每个流) 设置音频采样格式。使用-sample_fmts获取支持的样本格式列表。
-af filtergraph(输出) 创建由filtergraph指定的过滤器图,并使用它来过滤流。
了解了这些基本信息后,接下来我们看看 FFMPEG 具体都能干些什么吧。

录制

首先通过下面的命令查看一下 mac 上都有哪些设备。
ffmpeg -f avfoundation -list_devices true -i ""

录屏

ffmpeg -f avfoundation -i 1 -r 30 out.yuv

  • -f 指定使用 avfoundation 采集数据。
  • -i 指定从哪儿采集数据,它是一个文件索引号。在我的MAC上,1代表桌面(可以通过上面的命令查询设备索引号)。
  • -r 指定帧率。按ffmpeg官方文档说-r与-framerate作用相同,但实际测试时发现不同。-framerate 用于限制输入,而-r用于限制输出。
    注意,桌面的输入对帧率没有要求,所以不用限制桌面的帧率。其实限制了也没用。

录屏+声音

ffmpeg -f avfoundation -i 1:0 -r 29.97 -c:v libx264 -crf 0 -c:a libfdk_aac -profile:a aac_he_v2 -b:a 32k out.flv

  • -i 1:0 冒号前面的 “1” 代表的屏幕索引号。冒号后面的”0”代表的声音索相号。
  • -c:v 与参数 -vcodec 一样,表示视频编码器。c 是 codec 的缩写,v 是video的缩写。
  • -crf 是 x264 的参数。 0 表式无损压缩。
  • -c:a 与参数 -acodec 一样,表示音频编码器。
  • -profile 是 fdk_aac 的参数。 aac_he_v2 表式使用 AAC_HE v2 压缩数据。
  • -b:a 指定音频码率。 b 是 bitrate的缩写, a是 audio的缩与。

录视频

ffmpeg -framerate 30 -f avfoundation -i 0 out.mp4

  • -framerate 限制视频的采集帧率。这个必须要根据提示要求进行设置,如果不设置就会报错。
  • -f 指定使用 avfoundation 采集数据。
  • -i 指定视频设备的索引号。

视频+音频

ffmpeg -framerate 30 -f avfoundation -i 0:0 out.mp4

录音

ffmpeg -f avfoundation -i :0 out.wav

录制音频裸数据

ffmpeg -f avfoundation -i :0 -ar 44100 -f s16le out.pcm

分解与复用

流拷贝是通过将 copy 参数提供给-codec选项来选择流的模式。它使得ffmpeg省略了指定流的解码和编码步骤,所以它只能进行多路分解和多路复用。 这对于更改容器格式或修改容器级元数据很有用。 在这种情况下,上图将简化为:

分解与复用

由于没有解码或编码,速度非常快,没有质量损失。 但是,由于许多因素,在某些情况下可能无法正常工作。 应用过滤器显然也是不可能的,因为过滤器处理未压缩的数据。

抽取音频流

ffmpeg -i input.mp4 -acodec copy -vn out.aac

  • acodec: 指定音频编码器,copy 指明只拷贝,不做编解码。
  • vn: v 代表视频,n 代表 no 也就是无视频的意思。

抽取视频流

ffmpeg -i input.mp4 -vcodec copy -an out.h264

  • vcodec: 指定视频编码器,copy 指明只拷贝,不做编解码。
  • an: a 代表视频,n 代表 no 也就是无音频的意思。

转格式

ffmpeg -i out.mp4 -vcodec copy -acodec copy out.flv
上面的命令表式的是音频、视频都直接 copy,只是将 mp4 的封装格式转成了flv。

音视频合并

ffmpeg -i out.h264 -i out.aac -vcodec copy -acodec copy out.mp4

处理原始数据

提取YUV数据

ffmpeg -i input.mp4 -an -c:v rawvideo -pixel_format yuv420p out.yuv ffplay -s wxh out.yuv

  • -c:v rawvideo 指定将视频转成原始数据
  • -pixel_format yuv420p 指定转换格式为yuv420p

YUV转H264

ffmpeg -f rawvideo -pix_fmt yuv420p -s 320x240 -r 30 -i out.yuv -c:v libx264 -f rawvideo out.h264

提取PCM数据

ffmpeg -i out.mp4 -vn -ar 44100 -ac 2 -f s16le out.pcm ffplay -ar 44100 -ac 2 -f s16le -i out.pcm

PCM转WAV

ffmpeg -f s16be -ar 8000 -ac 2 -acodec pcm_s16be -i input.raw output.wav

滤镜

在编码之前,ffmpeg可以使用libavfilter库中的过滤器处理原始音频和视频帧。 几个链式过滤器形成一个过滤器图形。 ffmpeg区分两种类型的过滤器图形:简单和复杂。

简单滤镜

简单的过滤器图是那些只有一个输入和输出,都是相同的类型。 在上面的图中,它们可以通过在解码和编码之间插入一个额外的步骤来表示:

简单滤镜1

简单的filtergraphs配置了per-stream-filter选项(分别为视频和音频使用-vf和-af别名)。 一个简单的视频filtergraph可以看起来像这样的例子:

简单滤镜2

请注意,某些滤镜会更改帧属性,但不会改变帧内容。 例如。 上例中的fps过滤器会改变帧数,但不会触及帧内容。 另一个例子是setpts过滤器,它只设置时间戳,否则不改变帧。

复杂滤镜

复杂的过滤器图是那些不能简单描述为应用于一个流的线性处理链的过滤器图。 例如,当图形有多个输入和/或输出,或者当输出流类型与输入不同时,就是这种情况。 他们可以用下图来表示:

复杂滤镜1.png

复杂的过滤器图使用-filter_complex选项进行配置。 请注意,此选项是全局性的,因为复杂的过滤器图形本质上不能与单个流或文件明确关联。
-lavfi选项等同于-filter_complex。
一个复杂的过滤器图的一个简单的例子是覆盖过滤器,它有两个视频输入和一个视频输出,包含一个视频叠加在另一个上面。 它的音频对应是amix滤波器。

添加水印

ffmpeg -i out.mp4 -vf "movie=logo.png,scale=64:48[watermask];[in][watermask] overlay=30:10 [out]" water.mp4

  • -vf中的 movie 指定logo位置。scale 指定 logo 大小。overlay 指定 logo 摆放的位置。

    删除水印

    先通过 ffplay 找到要删除 LOGO 的位置
    ffplay -i test.flv -vf delogo=x=806:y=20:w=70:h=80:show=1
    使用 delogo 滤镜删除 LOGO
    ffmpeg -i test.flv -vf delogo=x=806:y=20:w=70:h=80 output.flv

    视频缩小一倍

    ffmpeg -i out.mp4 -vf scale=iw/2:-1 scale.mp4
  • vf scale 指定使用简单过滤器 scale,iw/2:-1 中的 iw 指定按整型取视频的宽度。 -1 表示高度随宽度一起变化。

    视频裁剪

    ffmpeg -i VR.mov -vf crop=in_w-200:in_h-200 -c:v libx264 -c:a copy -video_size 1280x720 vr_new.mp4
    crop 格式:crop=out_w:out_h:x:y
  • out_w: 输出的宽度。可以使用 in_w 表式输入视频的宽度。
  • out_h: 输出的高度。可以使用 in_h 表式输入视频的高度。
  • x : X坐标
  • y : Y坐标

如果 x和y 设置为 0,说明从左上角开始裁剪。如果不写是从中心点裁剪。

倍速播放

ffmpeg -i out.mp4 -filter_complex "[0:v]setpts=0.5*PTS[v];[0:a]atempo=2.0[a]" -map "[v]" -map "[a]" speed2.0.mp4

  • -filter_complex 复杂滤镜,[0:v]表示第一个(文件索引号是0)文件的视频作为输入。setpts=0.5*PTS表示每帧视频的pts时间戳都乘0.5 ,也就是差少一半。[v]表示输出的别名。音频同理就不详述了。
  • map 可用于处理复杂输出,如可以将指定的多路流输出到一个输出文件,也可以指定输出到多个文件。”[v]” 复杂滤镜输出的别名作为输出文件的一路流。上面 map的用法是将复杂滤镜输出的视频和音频输出到指定文件中。

对称视频

ffmpeg -i out.mp4 -filter_complex "[0:v]pad=w=2*iw[a];[0:v]hflip[b];[a][b]overlay=x=w" duicheng.mp4

  • hflip 水平翻转
    如果要修改为垂直翻转可以用vflip。

    画中画

    ffmpeg -i out.mp4 -i out1.mp4 -filter_complex "[1:v]scale=w=176:h=144:force_original_aspect_ratio=decrease[ckout];[0:v][ckout]overlay=x=W-w-10:y=0[out]" -map "[out]" -movflags faststart new.mp4

录制画中画

1
2
3
4
5
ffmpeg  -f avfoundation -i "1" -framerate 30 -f avfoundation -i "0:0"
-r 30 -c:v libx264 -preset ultrafast
-c:a libfdk_aac -profile:a aac_he_v2 -ar 44100 -ac 2
-filter_complex "[1:v]scale=w=176:h=144:force_original_aspect_ratio=decrease[a];[0:v][a]overlay=x=W-w-10:y=0[out]"
-map "[out]" -movflags faststart -map 1:a b.mp4

多路视频拼接

1
ffmpeg  -f avfoundation -i "1" -framerate 30 -f avfoundation   -i "0:0" -r 30 -c:v libx264 -preset ultrafast -c:a libfdk_aac -profile:a aac_he_v2 -ar 44100 -ac 2 -filter_complex "[0:v]scale=320:240[a];[a]pad=640:240[b];[b][1:v]overlay=320:0[out]" -map "[out]" -movflags faststart  -map 1:a  c.mp4

音视频的拼接与裁剪

裁剪

ffmpeg -i out.mp4 -ss 00:00:00 -t 10 out1.mp4

  • -ss 指定裁剪的开始时间,精确到秒
  • -t 被裁剪后的时长。

合并

首先创建一个 inputs.txt 文件,文件内容如下:

1
2
3
file '1.flv'
file '2.flv'
file '3.flv'

然后执行下面的命令:
ffmpeg -f concat -i inputs.txt -c copy output.flv

hls切片
ffmpeg -i out.mp4 -c:v libx264 -c:a libfdk_aac -strict -2 -f hls out.m3u8

  • -strict -2 指明音频使有AAC。
  • -f hls 转成 m3u8 格式。

视频图片互转

视频转JPEG

ffmpeg -i test.flv -r 1 -f image2 image-%3d.jpeg

视频转gif

ffmpeg -i out.mp4 -ss 00:00:00 -t 10 out.gif

图片转视频

ffmpeg -f image2 -i image-%3d.jpeg images.mp4

直播相关

推流

ffmpeg -re -i out.mp4 -c copy -f flv rtmp://server/live/streamName

拉流保存

ffmpeg -i rtmp://server/live/streamName -c copy dump.flv

转流

ffmpeg -i rtmp://server/live/originalStream -c:a copy -c:v copy -f flv rtmp://server/live/h264Stream

实时推流

ffmpeg -framerate 15 -f avfoundation -i "1" -s 1280x720 -c:v libx264 -f flv rtmp://localhost:1935/live/room ffplay

播放YUV 数据

ffplay -pix_fmt nv12 -s 192x144 1.yuv

播放YUV中的 Y平面

ffplay -pix_fmt nv21 -s 640x480 -vf extractplanes='y' 1.yuv

前言

前一篇有对WebRTC以及用到的协议做了一些简单介绍。

先回忆下WebRTC终端的五个流程:

  • 获取权限(摄像头、麦克风)
  • 本地视频的采集与展示
  • 创建RTCPeerConnection
  • 媒体协商
  • 远端视频的展示

媒体协商

在双方通信时,双方必须清楚彼此使用的编解码器是什么,也必须知道传输过来的音视频流的 SSRC。媒体协商的作用就是让双方找到共同支持的媒体能力,如双方都支持的编解码器,从而最终实现彼此之间的音视频通信。

步骤:

  • 创建一个 RTCPeerConnection 对象
  • createOffer ,创建 Offer;
  • createAnswer,创建 Answer;
  • setLocalDescription,设置本地 SDP 信息;
  • setRemoteDescription,设置远端的 SDP 信息。

流程叙述:

首先,呼叫方创建 Offer 类型的 SDP 消息。创建完成后,调用 setLocalDescriptoin 方法将该 Offer 保存到本地 Local 域,然后通过信令将 Offer 发送给被呼叫方。

被呼叫方收到 Offer 类型的 SDP 消息后,调用 setRemoteDescription 方法将 Offer 保存到它的 Remote 域。作为应答,被呼叫方要创建 Answer 类型的 SDP 消息,Answer 消息创建成功后,再调用 setLocalDescription 方法将 Answer 类型的 SDP 消息保存到本地的 Local 域。最后,被呼叫方将 Answer 消息通过信令发送给呼叫方。至此,被呼叫方的工作就完部完成了。

接下来是呼叫方的收尾工作,呼叫方收到 Answer 类型的消息后,调用 RTCPeerConnecton 对象的 setRemoteDescription 方法,将 Answer 保存到它的 Remote 域。

至此,整个媒体协商过程处理完毕。

WebRTC建立连接

首先会尝试 NAT 穿越,即尝试端到端直连。如果能够穿越成功,那双方就通过直连的方式传输数据,这是最高效的。但如果 NAT 穿越失败,为了保障通信双方的连通性,WebRTC 会使用中继方式,当然使用这种方式传输效率会低一些。

在整个过程中,WebRTC 使用优先级的方法去建立连接,即局域网内的优先级最高,其次是 NAT 穿越,再次是通过中继服务器进行中转,这样就巧妙地实现了“既要高效传输,又能保证连通率”这个目标。

基本操作

LOG放文件内容
EDIT剪辑
VFX加文字等效果
AUDIO添加音频

LOG

Project Contents
Local Files
Audio Network
Pond5

EDIT

A开头的是视频文件本身自带的音效,点一下变暗后播放就没有这个音效了

剪切和合并点X键,剪切后可以随意看奥运与组合,点击不要的部分点邮件删除

右键点击速度可变慢或加快播放速度,不要的话就点删除,跨界见CTRL+Z可以还原上一步操作

可覆盖原本的音频或家在下面

VFX

点击+添加文字,改变字体大小和颜色

AUDIO

音量大小等修改

保存文件点右键出口-媒体文件-一般是MP4/AVI 720适宜,当然越大也越清楚,文件内存也越大

2.界面和新建工程

3.导入素材和新建序列

序列之间是不能嵌套的。

4.时间线操作&选定素材区域插入时间轴

同时时间轴上的素材可以左右拖拉:切换位置、前后时间延长

5.时间轴素材调整&音频轨道同步

方法一

键盘的加减号是放大和缩小时间轴

方法二

Slip - Y点击空格键播放,选中素材的另外前后素材位置没有变化,播放时长也没有变化,而该选中素材则随着播放,时间慢慢增加。

Slide - T选中素材没有变化。

Trim In - W

Trim Out - E在出点标记处进行延长或缩短

tips

1.假设只对视频进行缩减时,这会导致音视频不同轨,处理方法

2.

3.快捷键

j 倒方

k 停止

l 素材向右播放,重复按下j会加速向右播放

6.添加转场&转场相关设置

添加转场步骤

先要通过拖动素材,让两个素材的某个部分重叠,留出转场的空间。

音频和视频转场都是一样~~~操作差不多

让结尾处渐暗

7.VFX节本操作&剪辑播放速度调整

添加字幕

8.调整素材播放速度

时间轴-右键-Speed-设置速度即可

8.Routing简介&应用

9.音频效果窗口&导出设置

渐入音效

让关键帧效果位置整体改变

其他的修音设置

导出设置

附录

Lightworks 14 Tutorials 中文字幕教程

Lightworks 软件官方地址