百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

音视频开发需要你懂得 ffmpeg 开源库的编码原理

moboyou 2025-07-03 17:07 3 浏览

引言

音视频开发需要你懂得音视频中一些基本概念,针对编解码而言,我们必须提前懂得编解码器的一些特性, 码流的结构,码流中一些重要信息sps,pps,vps,start code 以及基本的工作原理,而大多同学都只是一知半解,所以导致代码中的部分内容虽可以简单理解却不知其意


FFmpeg 是什么?

FFmpeg 既是一款音视频编解码工具,同时也是一组音视频编解码开发套件,作为编解码开发套件,它为开发者提供了丰富的音视频的调用接口

FFmpeg 中的 “FF” 指的是 “Fast Forward”FFmpeg 中的 “mpeg” 则是 “Moving Picture Experts Group”(动态图像专家组)

强大的功能

FFMpeg 提供了多种媒体格式的封装和解封装,包括多种音视频编码多种协议的流媒体、多种色彩格式转换、多种采样率转换、多种码率转换等;FFmpeg 框架提供了多种丰富的插件模块包含封装与解封装的插件、编码与解码的插件

FFmpeg 模块分类

打开 FFmpeg 源码,会发现有一系列 libavxxx 的模块,这些模块很好地划分了代码的结构和分工

  • libavformat,format,格式封装
  • libavcodec,codec,编码、解码
  • libavutil,util,通用音视频工具,像素、IO、时间等工具
  • libavfilter,filter,过滤器,可以用作音视频特效处理
  • libavdevice,device,设备(摄像头、拾音器)
  • libswscale,scale,视频图像缩放,像素格式互换
  • libavresample,resample,重采样
  • libswresample,也是重采样,类似图像缩放
  • libpostproc,后期处理

FFmpeg 数据结构简介

AVFormatContext

封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息

iformat:输入视频的AVInputFormat
nb_streams :输入视频的AVStream 个数
streams :输入视频的AVStream []数组
duration :输入视频的时长(以微秒为单位)
bit_rate :输入视频的码率

AVInputFormat

每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体

name:封装格式名称
long_name:封装格式的长名称
extensions:封装格式的扩展名
id:封装格式ID  
一些封装格式处理的接口函数

AVStream

视频文件中每个视频(音频)流对应一个该结构体

id:序号
codec:该流对应的AVCodecContext
time_base:该流的时基
r_frame_rate: 该流的帧率

AVCodecContext

编码器上下文结构体,保存了视频(音频)编解码相关信息

codec:编解码器的AVCodec
width, height:图像的宽高(只针对视频)
pix_fmt:像素格式(只针对视频)
sample_rate:采样率( 只针对音频)
channels:声道数(只针对音频)
sample_fmt:采样格式(只针对音频)

AVCodec

每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体

name:编解码器名称
long_name:编解码器长名称
type:编解码器类型
id:编解码器ID
一些编解码的接口函数

AVPacket

存储一帧压缩编码数据

pts:显示时间戳
dts :解码时间戳
data :压缩编码数据
size :压缩编码数据大小
stream_index :所属的AVStream

AVFrame

存储一帧解码后像素(采样)数据

data:解码后的图像像素数据(音频采样数据)。
linesize:对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小。
width, height:图像的宽高(只针对视频)。
key_frame:是否为关键帧(只针对视频) 。
pict_type:帧类型(只针对视频) 。例如I, P, B。

FFmpeg的一些应用场景

下面介绍一下 FFmpeg 都用在了哪里(在这里仅列几个我所知的,其实远比这个多)。说白了就是为了说明:FFmpeg 是非常重要的。

使用 FFmpeg 作为内核视频播放器:

  • Mplayer,ffplay,射手播放器,暴风影音,KMPlayer,QQ影音...

使用 FFmpeg 作为内核的 Directshow Filter:

  • ffdshow,lav filters...

使用 FFmpeg 作为内核的转码工具:

  • ffmpeg,格式工厂...

事实上,FFmpeg 的音视频编解码功能确实太强大了,几乎囊括了现存所有的音视频编码标准,因此只要做音视频开发,几乎离不开它

至此,我们今天 FFmpeg 的相关编码原理就介绍到这里了;希望以上的内容能够对大家有所帮助,关于 FFmpeg 的相关技术问题,我们还要去好好的学习剖析;因此我把工作中遇到的 音视频 FFmpeg 编码器问题,以及对网上大部分的资料的收集和整理,最终整合出了一份 《高级音视频开发学习笔记》,有需要这份学习笔记的朋友,可以 私信 发送 “笔记” 即可 免费获取

内容展示如下:

高级音视频开发学习笔记目录

基础部分

  • C++ 基本知识总结
  • C 和C++ 的主要区别是什么?
  • 结构程序设计和面向对象程序设计的概念
  • 什么是类和对象?
  • 面向对象程序设计的三大特征是什么?
  • 类的组成
  • 结构体和类的区别是什么?
  • 类对象的定义方法和对象成员的表示方法
  • 构造函数和析构函数

高级音视频开发学习笔记获取方式 :私信发送 “笔记” 即可 免费获取

FFmpeg 编译过程

  • 准备资料
  • ndk 环境配置
  • 编写脚本文件

FFmpeg 引入 AndroidStudio

  • 新建项目
  • 配置 build.gradle
  • 配置 CMakeLists.txt 文件
  • 编写测试代码(头文件一定要用 extern 包含住)

高级音视频开发学习笔记获取方式 :私信发送 “笔记” 即可 免费获取

音视频格式封装原理

  • 视频解码基础 01 -封裝格式
  • 视频文件封装格式
  • 音视频编码方式简介
  • 视频编码方式
  • 音频编码方式
  • MP3
  • AAC
  • WMA

H264 编码基础 06 -- 编码标准之战

  • 一个视频标准的普及其实是商业利益博弈的结果
  • 一个视频标准能普及还在于他的对手
  • WMV
  • VP8
  • AV1

H264 编码基础 01 帧与场

  • 视频序列帧、场编码方式
  • H264 编码(帧内预测)
  • 视频流 H264 的组装
  • 三种帧的说明
  • 压缩算法的说明
  • 手写 H264 编码器

有需要完整版高级音视频开发学习笔记的朋友:可以 私信 发送 “笔记” 即可 免费获取

对于程序员来说,要学习的知识内容、技术有太多太多,要想不被环境淘汰就只有不断提升自己,从来都是我们去适应环境,而不是环境来适应我们

技术是无止境的,你需要对自己提交的每一行代码、使用的每一个工具负责,不断挖掘其底层原理,才能使自己的技术升华到更高的层面

加油!让我们早日成为音视频高级开发者

相关推荐

黄道十二宫杀手密码51年后被破解,来自两位程序员和数学家合作

杨净边策发自凹非寺量子位报道|公众号QbitAI黄道十二宫杀手(ZodiacKiller)可能是世界上最知名的高智商连环杀手,52年来从未被抓获。他的事迹已被改编成了多部好莱坞电影。△...

深入剖析MediaCodec解码器的基本原理及使用「建议新手收藏」

一,MediaCodec工作原理MediaCodec类Android提供的用于访问低层多媒体编/解码器接口,它是Android低层多媒体架构的一部分,通常与MediaExtractor、MediaMu...

Retrofit WebService 实践

前言作为Android开发,平时和后端聊得最多的除了喝酒就是接口。常用语:Restful和WebService,前者现在聊得多,后者以前聊得多。默认含义分别为:Restful:HTTP协议...

建议收藏!175部4K UHD版本经典高分电影洗版参考目录(2015之前)

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:1L789近两年很多经典高分老电影陆续开始重制成4KUHD版本,虽然我早已将这些电影的BD蓝光版收入,但纠结一番后还是花了不少时间将其全部...

2 个月的面试亲身经历告诉大家,如何进入 BAT 等大厂?

这篇文章主要是从项目来讲的,所以,从以下几个方面展开。怎么介绍项目?怎么介绍项目难点与亮点?你负责的模块?怎么让面试官满意?怎么介绍项目?我在刚刚开始面试的时候,也遇到了这个问题,也是我第一个思考的问...

详解Android官推Kotlin-First的图片加载库

前言Coil是一个非常年轻的图片加载库,在2020年10月22日才发布了1.0.0版本,但却受到了Android官方的推广,在AndroidDevelopersBackst...

webview 渲染机制:硬件加速方式渲染的Android Web

webview渲染是什么?webview渲染是用于展现web页面的控件;webview可以内嵌在移动端,实现前端的混合式开发,大多数混合式开发框架都是基于webview模式进行二次开发的w...

因为我对Handler的了解,居然直接给我加了5K

1Handler是什么?android提供的线程切换工具类。主要的作用是通过handler实现从子线程切换回主线程进行ui刷新操作。1.1为什么Handler能实现线程切换?在创建Handler的...

「经典总结」一个View,从无到有会走的三个流程,你知道吗?

前言一个View,从无到有会走三个流程,也就是老生常谈的measure,layout,draw三流程我们都知道Android视图是由一层一层构成的层级结构,直白点说,就是父View包含子View而子V...

这些垃圾代码是谁写的?哦,原来小丑竟是我自己

程序员是最喜欢自嘲、自黑的群体之一,比如他们常常称自己是“码农”、“程序猿”,再比如他们的工作明明是写代码、修Bug,也有人调侃说:“明明我们是修代码、写Bug!”本文整理了一些程序员“修代码、写...

手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇

/1前言/平时我们要下载图片,要要一个一个点击下载是不是觉得很麻烦?那有没有更加简便的方法呢?答案是肯定的,这里我们以天堂网为例,批量下载天堂网的图片。/2项目准备工作/首先我们第一步我们要安装...

音视频开发需要你懂得 ffmpeg 开源库的编码原理

引言音视频开发需要你懂得音视频中一些基本概念,针对编解码而言,我们必须提前懂得编解码器的一些特性,码流的结构,码流中一些重要信息如sps,pps,vps,startcode以及基本的工作原理,...

「8年老 Android 开发」最全最新 Android 面试题系列全家桶(带答案)

下面跟大家分享的这些面试题都是互联网大厂真实流出的面试内容,每个问题都附带完整详细的答案,不像网上的那些资料三教九流有的甚至还没答案,这些面试题我也是经过日积月累才整理出来的精品资料。这些面试题主要是...

手把手教你爬取天堂网1920*1080大图片(批量下载)——实战篇

/1前言/上篇文章手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇我们谈及了天堂网站图片抓取的理论,这篇文章将针对上篇文章的未尽事宜进行完善,完成图片的批量抓取。/2图片网址解...

PHP 8.1.9 更新发布

CLI:修复了内置服务器通过PHP_CLI_server_WORKERS环境变量的潜在溢出。修正了GH-8952(不再可能有意关闭std句柄)。Core:修复了GH-8923的错误(Windows上的...