「ffmpeg」的基本使用
关于我如何了解到ffmpeg
: 我在网页使用IDM
下载视频时弹出这样一个提示:
在搜寻过程中发现可以使用 ffmpeg
解决
安装 ffmpeg
下载
配置环境变量
下载完解压以后,放到文件目录下
复制如图所示的路径,右键此电脑->属性->高级系统设置
点击环境变量,然后点进Path
,然后点击新建,粘贴即可
验证安装成功
ffmpeg -version
显示这个画面就代表已经安装成功了
简单使用
下载受保护的视频
首先复制链接
在命令行输入
1 | ffmpeg -i 复制的网址 test.mp4 |
下载成功后是这个状态:
保存的路径在 C 盘的用户目录下:
如果保存到其他目录,可以在打开cmd
以后输入’E:’, 然后再执行上面的命令
从视频中抽取音频
1 | ffmpeg -i test.mp4 -vn test_audio.mp3 |
抽取的效率还是很高的
从视频中抽取视频(让视频静音)
1 | ffmpeg -i test.mp4 -an mute_video.mp4 |
获取媒体文件信息
语法为 ffmpeg -i file_name
例如
1 | ffmpeg -i test.mp4 |
转换媒体格式
1 | ffmpeg -i test.mp4 test_output.avi |
你也可以同时指定多个输出后缀:
1 | ffmpeg -i test.mp4 test_output_1.mov audio_output_2.mkv |
想看支持的格式,可以用:
1 | ffmpeg -formats |
从视频中提取图片
1 | ffmpeg -i "test.mp4" -r 1 -q:v 2 -f image2 image-3%d.jpeg |
-r
选项设置每 1 秒提取一张图片
之后有一个重要的选项是-q:v,它用来设置提取到的图片质量,设置值为2来从视频中获取高质量图片%3d
来指示输出的图片有三位数字 (000, 001, 等等)你也可以用 %2d
(两位数字) 或者 %4d
(4位数字)
更改视频分辨率或长宽比
使用 -s
参数
1 | ffmpeg -i test.mp4 -s 1024x576 test_576.mp4 |
同时,你可能需要使用 -c:a
来保证音频编码是正确的:
1 | ffmpeg -i test.mp4 -s 640x480 -c:a test_480.mp4 |
你也可是使用-aspect
来更改长宽比:
1 | ffmpeg -i test.mp4 -aspect 4:3 test_43.mp4 |
为视频增加字幕
另一个常见又很容易实现的要求是给视频增加字母,比如一部外文电源,使用下面的命令:
1 | ffmpeg -i video.mp4 -i subtitles.srt -c:v copy -c:a copy -preset veryfast -c:s mov_text -map 0 -map 1 output.mp4 |
当然,你可以指定自己的编码器和任何其他的音频视频参数。你可以阅读这篇文章来了解字幕相关内容 editing subtitles in Linux 。
压缩媒体文件
压缩文件可以极大减少文件的体积,节约存储空间,这对于文件传输尤为重要。通过ffmepg,有好几个方法来压缩文件体积。
Note: 文件压缩的太厉害会让文件质量显著降低。
首先,对于音频文件,可以通过降低比特率(使用 -b:a 或 -ab):
1 | ffmpeg -i audio_input.mp3 -ab 128k audio_output.mp3 |
再次重申,一些常用的比特率有: 96k, 112k, 128k, 160k, 192k, 256k, 320k.值越大,文件所需要的体积就越大。
对于视频文件,选项就多了,一个简单的方法是通过降低视频比特率 (通过 -b:v):
1 | ffmpeg -i video_input.mp4 -b:v 1000k -bufsize 1000k video_output.mp4 |
Note: 视频的比特率和音频是不同的(一般要大得多)。
你也可以使用 -crf 参数 (恒定质量因子). 较小的crf 意味着较大的码率。同时使用 libx264 编码器也有助于减小文件体积。这里有个例子,压缩的不错,质量也不会显著变化:
1 | ffmpeg -i video_input.mp4 -c:v libx264 -crf 28 video_output.mp4 |
crf 设置为20 到 30 是最常见的,不过您也可以尝试一些其他的值。
降低帧率在有些情况下也能有效(不过这往往让视频看起来很卡):
1 | ffmpeg -i video_input.mp4 -r 24 video_output.mp4 |
-r 指示了帧率 (这里是 24)。
你还可以通过压缩音频来降低视频文件的体积,比如设置为立体声或者降低比特率:
1 | ffmpeg -i video_input.mp4 -c:v libx264 -ac 2 -c:a aac -strict -2 -b:a 128k -crf 28 video_output.mp4 |
Note: -strict -2 和 -ac 2 是来处理立体声部分的。
裁剪媒体文件(基础)
想要从开头开始剪辑一部分,使用T -t 参数来指定一个时间:
1 | ffmpeg -i input_video.mp4 -t 5 output_video.mp4 |
这个参数对音频和视频都适用,上面两个命令做了类似的事情:保存一段5s的输出文件(文件开头开始算)。上面使用了两种不同的表示时间的方式,一个单纯的数字(描述)或者 HH:MM:SS (小时, 分钟, 秒). 第二种方式实际上指示了结束时间。
也可以通过 -ss 给出一个开始时间,**-to** 给出结束时间:
1 | ffmpeg -i input_audio.mp3 -ss 00:01:14 output_audio.mp3 |
可以看到 开始时间 (-ss HH:MM:SS), 持续秒数 (-t duration), 结束时间 (-to HH:MM:SS), 和开始秒数 (-s duration)的用法.
你可以在媒体文件的任何部分使用这些命令。
输出YUV420
原始数据
对于一下做底层编解码的人来说,有时候常要提取视频的YUV原始数据。 怎么坐?很简答: ffmpeg -i input.mp4 output.yuv
怎么样,是不是太简单啦?!!!哈哈(如果你想问yuv的数据,如何播放,我不会告诉你,RawPlayer挺好用的!!)
那如果我只想要抽取某一帧YUV呢? 简单,你先用上面的方法,先抽出jpeg图片,然后把jpeg转为YUV。 比如: 你先抽取10帧图片。 ffmpeg -i input.mp4 -ss 00:00:20 -t 10 -r 1 -q:v 2 -f image2 pic-%03d.jpeg
结果:
1 | -rw-rw-r-- 1 hackett hackett 296254 7月 20 16:08 pic-001.jpeg |
然后,你就随便挑一张,转为YUV: ffmpeg -i pic-001.jpeg -s 1440x1440 -pix_fmt yuv420p xxx3.yuv
如果-s参数不写,则输出大小与输入一样。当然了,YUV还有yuv422p啥的,你在-pix_fmt 换成yuv422p就行啦!
视频添加logo
1 | ffmpeg -i input.mp4 -i logo.png -filter_complex overlay output.mp4 |
提取视频ES
数据
1 | ffmpeg –i input.mp4 –vcodec copy –an –f m4v output.h264 |
视频码格式转换
比如一个视频的编码是MPEG4,想用H264编码,咋办?
1 | ffmpeg -i input.mp4 -vcodec h264 output.mp4 |
相反也一样
1 | ffmpeg -i input.mp4 -vcodec mpeg4 output.mp4 |
添加字幕
语法 –vf subtitles=file
1 | ffmpeg -i jidu.mp4 -vf subtitles=rgb.srt output.mp4 |
ffmpeg
: 高级使用
现在该开始讲述一些高级的特性了(比如截屏等),让我们开始吧。
分割媒体文件
前面已经讲述了如何裁剪文件,那么如何分割媒体文件呢?只需要为每个输出文件分别指定开始时间、结束或者持续时间就可以了。
看下面这个例子:
1 | ffmpeg -i video.mp4 -t 00:00:30 video_1.mp4 -ss 00:00:30 video_2.mp4 |
语法很简单,为第一个文件指定了 -t 00:00:30 作为持续时间(第一个部分是原始文件的前30秒内容),然后指定接下来的所有内容作为第二个文件(从第一部分的结束时间开始,也就是 00:00:30)。
你可以任意指定多少个部分,尝试一下吧,这个功能真的很厉害,同时它也适用用音频文件。
拼接媒体文件
ffmpeg 也可以进行相反的动作:把多个文件合在一起。
为了实现这一点,你得用自己顺手的编辑器来创建一个文本文件。
因为我喜欢使用终端,所以这里我用了 touch 和 vim. 文件名无关紧要,这里我用 touch 命令创建 video_to_join.txt 文件:
1 | touch videos_to_join.txt |
现在,使用 vim 编辑它:
1 | vim videos_to_join.txt |
你可以使用任何你喜欢的工具,比如nano,gedit等等。
在文件内容中, 输入您想拼接的文件的完整路径(文件会按照顺序拼合在一起),一行一个文件。确保他们拥有相同的后缀名。下面是我的例子:
1 | /home/ubuntu/Desktop/video_1.mp4 |
保存这个文件,同样这个方法适用与任何音频或者视频文件。
然后使用下面的命令:
1 | ffmpeg -f concat -i join.txt output.mp4 |
Note: 使用的输出文件的名称是 output.mp4, 因为我的输入文件都是mp4的 。
这样,你 videos_to_join.txt 里的所有文件都会被拼接成一个独立的文件了。
将图片转变为视频
这会告诉你如何将图片变成幻灯片秀,同时也会告诉你如何加上音频。
首先我建议您将所有的图片放到一个文件夹下面,我把它们放到了 my_photos 里,同时图片的后缀名最好是 .png 或者 .jpg, 不管选那个,他们应该是同一个后缀名,否则ffmpeg可能会工作的不正常,您可以很方便的把 .png 转变为 .jpg (或者倒过来也行)。
我们这次转换的格式 (-f) 应该被设置为 image2pipe. 你必须使用使用连词符(–)来指明输入。 image2pipe 允许你使用管道 (在命令间使用 |)的结果而不是文件作为ffmpeg的输入。命令结果便是将所有图片的内容逐个输出,还要注意指明视频编码器是 copy (-c:v copy) 以正确使用图片输入:
1 | cat my_photos/* | ffmpeg -f image2pipe -i - -c:v copy video.mkv |
如果你播放这个文件,你可能会觉得只有一部分图片被加入了,事实上所有的图片都在,但是ffmpeg 播放它们的时候太快了,默认是23fps,一秒播放了23张图片。
你应该指定帧率 (-framerate) :
1 | cat my_photos/* | ffmpeg -framerate 1 -f image2pipe -i - -c:v copy video.mkv |
在这个例子里,把帧率设置为1,也就是每帧(每张图)会显示1秒。
为了加一些声音,可以使用音频文件作为输入 (-i audo_file) 并且设定copy音频编码 (-c:a copy). 你可以同时为音频和视频设定编码器,在输出文件前设置就可以了。你要计算一下音频文件的长度和图片张数,已确定合适的帧率。比如我的音频文件是22秒,图片有9张,那么帧率应该是 9 / 22 大约0.4,所以我这么输入命令:
1 | cat my_photos/* | ffmpeg -framerate 0.40 -f image2pipe -i - -i audio.wav -c copy video.mkv |
录制屏幕
通过 ffmpeg 录制屏幕同样没有困难的,将格式(-f) 设定为x11grab. 他就会抓取你的XSERVER. 输入的话可以这是屏幕编号(一般都是0:0). 抓取是从左上角开始计算的,可以指定屏幕分辨率 (-s). 我的屏幕是 1920×1080. 注意屏幕分辨率硬在输入之前指定t:
1 | ffmpeg -f x11grab -s 1920x1080 -i :0.0 output.mp4 |
按 q 或者 CTRL+C 以结束录制屏幕。
**小技巧:*你可以通过命令获得真实的分辨率而不是写死一个固定的大小*:
1 | -s $(xdpyinfo | grep dimensions | awk '{print $2;}') |
完整的命令这么写:
1 | ffmpeg -f x11grab -s $(xdpyinfo | grep dimensions | awk '{print $2;}') -i :0.0 output.mp4 |
录制摄像头
从摄像头录制就更简单了,linux上设备都是在/dev中的,比如 /dev/video0, /dev/video1, etc.:
1 | ffmpeg -i /dev/video0 output.mkv |
同样, q 或者 CTRL+C 来结束录制。
录制声音
Linux上同时是使用 ALSA 和 pulseaudio 来处理声音的。 ffmpeg 可以录制两者,不过我要特别说明 pulseaudio, 因为 Debian 系列的发行版默认用了它。命令如下:
在 pulseaudio, 你必须强制指定(-f) alsa 然后指定 default 作为输入t (-i default):
1 | ffmpeg -f alsa -i default output.mp3 |
Note: 在你系统音频设置里,应该能看到默认的录音设备。
我经常玩吉他,我平时使用一个专业音频设备才能录制声音,当我发现ffmpeg也可以很轻松的录制的时候颇为惊讶。
录制小贴士
对于录制任务来说,通常都需要指定编码器以及帧率,之前讲过的参数当然也可以用到这里来!
1 | ffmpeg -i /dev/video0 -f alsa -i default -c:v libx264 -c:a flac -r 30 output.mkv |
有时候不直接录音,而是在录屏/录像的时候给一个音频文件,那么可以这么做:
1 | ffmpeg -f x11grab -s $(xdpyinfo | grep dimensions | awk '{print $2;}') -i :0.0 -i audio.wav -c:a copy output.mp4 |
Note: ffmpeg 使用片段录取,所有有时候非常短的录制可能不会保存文件。我建议录地可以稍微长一些(然后后期裁剪),已保证录制的文件成功写到磁盘上。
截图
每隔一秒截一张图
1 | ffmpeg -i input.flv -f image2 -vf fps=fps=1 out%d.png |
每隔20秒截一张图
1 | ffmpeg -i input.flv -f image2 -vf fps=fps=1/20 out%d.png |
ffmpeg中的过滤器的基本使用
过滤器 是 ffmpeg 中最为强大的功能。在ffmepg中有数不甚数的过滤器存在,可以满足各种编辑需要。因为过滤器实在太多了,这里只会简单讲述几个常用的。
使用 过滤的基本结构是:
1 | ffmpeg -i input.mp4 -vf "filter=setting_1=value_1:setting_2=value_2,etc" output.mp4 |
可以指定视频过滤器 (-vf, -filter:v的简写) 和 音频过滤器 (-af, -filter:a的简写). 过滤器的内容写到双引号里面 (“) 并且可以使用逗号(,)连接。你可以使用任意数量的过滤器(我写了个etc代表更多的,这不是做一个真实的过滤器)。
过滤器设定的通常格式是:
1 | filter=setting_2=value_2:setting_2=value_2 |
过滤器不同的值使用冒号分割。
你甚至可以在值里面使用进行数学符号计算。
Note: 参考 ffmpeg 过滤器手册*.*查看更多高级用法
这里举几个例子来说明视频和音频的过滤器。
视频缩放
这是个简单过滤器,设定里只有 width 和 height:
1 | ffmpeg -i input.mp4 -vf "scale=w=800:h=600" output.mp4 |
我说过你可以使用数学运算来给值:
1 | ffmpeg -i input.mkv -vf "scale=w=1/2*in_w:h=1/2*in_h" output.mkv |
很明显,这个命令让输入的尺寸变成了输入尺寸(in_w, in_h)的1/2.
视频裁剪
类似缩放,这个设定也有 width 和 height ,另外可以指定裁剪的原点(默认是视频的中心)
1 | ffmpeg -i input.mp4 -vf "crop=w=1280:h=720:x=0:y=0" output.mp4 |
第二个命令裁剪原点是视频的中心点(因为我没有给x和y坐标),第一个命令会从左上角开始裁剪 (x=0:y=0).
这里也有一个使用数学计算的例子:
1 | ffmpeg -i input.mkv -vf "crop=w=3/4*in_w:h=3/4*in_h" output.mkv |
这会把视频裁剪剩下原大小的3/4/。
视频旋转
你可以指定一个弧度,顺时针旋转视频。为了让计算简单一些,你可以给角度然后乘以 PI/180:
1 | ffmpeg -i input.avi -vf "rotate=90*PI/180" |
第一个命令将视频顺时针旋转90°,第二个则是上下颠倒了视频(翻转了180°)。
音频声道重映射
有的时候,你的音频只有右耳可以听到声音,那么这个功能就很有用了。你可以让声音同时在左右声道出现:
1 | ffmpeg -i input.mp3 -af "channelmap=1-0|1-1" output.mp3 |
这将右声道(1)同时映射到左(0)右(1)两个声道(左边的数字是输入,右边的数字是输出)。
更改音量
你可以将音量大小乘以一个实数(可以是整数也可以不是),你只需要给出那个数大小就行了。
1 | ffmpeg -i input.wav -af "volume=1.5" output.wav |
第一个将音量变为1.5倍,第二个则让音量变成了原来的1/4那么安静。
技巧:更改播放速度
这里会介绍视频(不影响音频)和音频的过滤器。
1.视频
视频过滤器是 setpts (PTS = presentation time stamp). 这个参数以一种有趣的方式工作,因为我们修改的是PTS,所以较大的数值意味着较慢的播放速度,反之亦然:
1 | ffmpeg -i input.mkv -vf "setpts=0.5*PTS" output.mkv |
第一个命令让播放速度加倍了,第二个则是让播放速度降低了一半。
2. 音频
这里的过滤器是 atempo. 这里有个限制,它只接受 0.5(半速) 到 2 (倍速)之间的值。为了越过这个限制,你可以链式使用这个过滤器:
1 | ffmpeg -i input.wav -af "atempo=0.75" output.wav |
第一个命令让音频速度慢了1/4,第二个则是加速到原来的4(2*2)倍。
Note: *如果想在同一个命令中同时修改视频和音频的速度,你得查看一下 filtergraphs.*
ffmpeg
主要组成部分
- libavformat:用于各种音视频封装格式的生成和解析,包括获取解码所需信息以生成解码上下文结构和读取音视频帧等功能,包含demuxers和muxer库;
- libavcod
- ec:用于各种类型声音/图像编解码;
- libavutil:包含一些公共的工具函数;
- libswscale:用于视频场景比例缩放、色彩映射转换;
- libpostproc:用于后期效果处理;
- ffmpeg:是一个命令行工具,用来对视频文件转换格式,也支持对电视卡实时编码;
- ffsever:是一个HTTP多媒体实时广播流服务器,支持时光平移;
- ffplay:是一个简单的播放器,使用ffmpeg 库解析和解码,通过SDL显示;
查看帮助
- 可用的bit流 :ffmpeg –bsfs
- 可用的编解码器:ffmpeg –codecs
- 可用的解码器:ffmpeg –decoders
- 可用的编码器:ffmpeg –encoders
- 可用的过滤器:ffmpeg –filters
- 可用的视频格式:ffmpeg –formats
- 可用的声道布局:ffmpeg –layouts
- 可用的license:ffmpeg –L
- 可用的像素格式:ffmpeg –pix_fmts
- 可用的协议:ffmpeg -protocals