OpenGL ES +MediaCodec音视频采集录制录

对于一个视频的录制,包括以下几个部分:
1,视频图像的采集
2,视频录像的编码录制
3,音频的采集
4,音频的编码录制
5,音视频的合成

涉及到的技术包括OpenGL ES、EGL、MediaCodec、AudioRecord、MediaMuxer。

一、视频的采集

这里使用OpenGL ES和GLSurfaceView进行摄像头画面的预览,视频的采集通过创建EGL环境。

通过MediaCodec创建一个surface,然后通过创建一个新的egl环境共享预览的EglContext和这个surface绑定,渲染fbo绑定的纹理,即可录制。

EGL14与EGL10区别:
EGL14是在Android 4.2(API 17)引入的,换言之API 17以下的版本不支持EGL14。
EGL10不支持OpenGL ES 2.x,因此在EGL10中某些相关常量参数只能用手写硬编码代替,例如EGL14.EGL_CONTEXT_CLIENT_VERSION以及EGL14.EGL_OPENGL_ES2_BIT等等。

1.1 EGL环境搭建

1.OpenGL ES 是Android绘图API,但OpenGL ES是平台通用的,在特定设备上使用需要一个中间层做适配,这个中间层就是EGL。

2.OpenGL ES 本质上是一个图形渲染管线的状态机,而 EGL 则是用于监控这些状态以及维护 Frame buffer 和其他渲染 Surface 的外部层,它管理图形上下文、表面/缓冲区绑定和呈现同步。


image.png

EGL架构图中的核心组成:
Display(EGLDisplay) :是对实际显示设备的抽象。
Surface(EGLSurface):是对用来存储图像的内存区域 FrameBuffer 的抽象,包括 Color Buffer, Stencil Buffer ,Depth Buffer。
Context (EGLContext) :存储 OpenGL ES绘图的一些状态信息。

EGL环境创建主要关键步骤:
①、创建EGLDisplay,得到默认的显示设备(窗口)

mEglDisplay = EGL14.eglGetDisplay(EGL14.EGL_DEFAULT_DISPLAY);

②、初始化显示设备

        boolean initResult = EGL14.eglInitialize(mEglDisplay,version,0,version,1);

③、配置显示设备的属性

        boolean configResult = EGL14.eglChooseConfig(mEglDisplay, eglConfigAttributes, 0, configs, 0, configs.length,

④、创建EglContext上下文

        int[] contextAttributeList = {
                EGL14.EGL_CONTEXT_CLIENT_VERSION,2,
                EGL14.EGL_NONE
        };

        mEglContext= EGL14.eglCreateContext(mEglDisplay,mEglConfig,eglContext ,contextAttributeList,0);

此处因为,视频录制需要创建的EGL上下文,需要获取摄像头预览时的EglContext上下文来进行创建。
⑤、创建Surface

        mEglSurface = EGL14.eglCreateWindowSurface(mEglDisplay, mEglConfig, surface, surfaceAttribList, 0);

此处的surface由MediaCodec创建得到。
⑥、绑定EglContext和Surface到显示设备

        boolean curResult = EGL14.eglMakeCurrent(mEglDisplay,mEglSurface,mEglSurface,mEglContext);

1.2 MediaCodec创建Surface绘制编码

private MediaCodec mMediaCodec;
private Surface mSurface;
mSurface = mMediaCodec.createInputSurface();

创建MediaCodec的输入Surface,然后通过1.2中创建EGL上下文环境,OpenGL将数据渲染到这个Surface上,MediaCodec就可以在内部拿到视频数据,进行视频编码了。

二、音频的采集

音频的采集使用AudioRecord进行。android中音频的采集一般使用AudioRecord或者MediaRecord。AudioRecord可以采集到一帧帧的PCM数据,而MediaRecorder可以将采集到的音频数据转化为编码格式保存。而此处场景因为需要将音频和视频混合,所以使用AudioRecord。

AudioRecord的初始化需要先创建一个AudioRecord实例。

    public AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat,
            int bufferSizeInBytes)

构造函数参数说明:
audioSource:音频输入源,一般使用MediaRecorder.AudioSource.MIC 麦克风。
sampleRateInHz:音频的采样频率,通常取值44100(44.1kHz)。
channelConfig:采集几个声道。双声道立体声用AudioFormat.CHANNEL_IN_STEREO。
audioFormat:指定采样PCM数据的采样格式。常用值有 ENCODING_PCM_8BIT、ENCODING_PCM_16BIT和ENCODING_PCM_FLOAT,值得强调的是ENCODING_PCM_16BIT可以保证兼容大部分Andorid手机。
bufferSizeInBytes:音频采集过程中需要的缓存区大小。一般根据采样率,通道数,已经采样格式来确定。

bufferSize = AudioRecord.getMinBufferSize(sampleRate, channels, audioFormat);

当开启音频采集后,通过循环不停调用AudioRecord的read函数来获取pcm数据

while(state == RECORDING){ //状态判断
    byte[] buffer = new byte[bufferSize];
                int readRecord = audioRecord.read(buffer, 0, bufferSize);
}

三、 视频和音频的编码

音视频的编码使用MediaCodec。MediaCodec类为开发者提供了能访问到Android底层媒体Codec(Encoder/Decoder)的能力,它是Android底层多媒体基础架构的一部分。

image.png

MediaCodec 架构上采用了2个缓冲区队列,异步处理数据,并且使用了一组输入输出缓存。
你请求或接收到一个空的输入缓存(input buffer),向其中填充满数据并将它传递给编解码器处理。编解码器处理完这些数据并将处理结果输出至一个空的输出缓存(output buffer)。

MediaCodec的状态转换如下:

image.png

在MediaCodec的生命周期内存在三种状态:Stopped, Executing or Released,其中
  Stopped状态包含三种子状态:Uninitialized, Configured and Error
  Executing状态包含三种子状态:Flushed, Running and End-of-Stream

  1. 当通过 MediaCodec.createByCodecName(...) or MediaCodec.createDecoderByType(...) or MediaCodec.createEncoderByType(...)三种方法中的任一种创建一个MediaCodec对象实例后,Codec将会处于 Uninitialized 状态;

2. 当你调用 MediaCodec.configure(...)方法对Codec进行配置后,Codec将进入 Configured 状态;

3. 之后可以调用 MediaCodec.start() 方法启动Codec,Codec会转入 Executing 状态,start后Codec立即进入 Flushed 子状态,此时的Codec拥有所有的input and output buffers,Client无法操作这些buffers;

4. 一旦第一个input buffer 出队列,也即Client通过调用 MediaCodec.dequeueInputBuffer(...)请求得到了一个有效的input buffer index, Codec立即进入到了 Running 子状态,在这个状态下Codec会进行实际的数据处理(解码、编码)工作,度过它生命周期的主要阶段;

5. 当输入端入队列一个带有 end-of-stream 标记的input buffer时(queueInputBuffer(EOS)),Codec将转入 End of Stream 子状态。在此状态下,Codec不再接受新的input buffer数据,但仍会处理之前入队列而未处理完的input buffer并产生output buffer,直到end-of-stream 标记到达输出端,数据处理的过程也随即终止;

6. 在 Executing状态下可以调用 MediaCodec.flush()方法使Codec进入 Flushed 子状态;

7. 在 Executing状态下可以调用 MediaCodec.stop()方法使Codec进入 Uninitialized 子状态,可以对Codec进行重新配置;

8. 极少数情况下Codec会遇到错误进入 Error 状态,可以调用 MediaCodec.reset() 方法使其再次可用;

9. 当MediaCodec数据处理任务完成时或不再需要MediaCodec时,可使用 MediaCodec.release()方法释放其资源。

主要调用流程:
1,初始化

        // 设置各种编码参数
        MediaFormat format = MediaFormat.createVideoFormat(MediaFormat.MIMETYPE_VIDEO_AVC,
                mWidth, mHeight);
        //颜色空间 从 surface当中获得
        format.setInteger(MediaFormat.KEY_COLOR_FORMAT, MediaCodecInfo.CodecCapabilities
                .COLOR_FormatSurface);
        int bitrate = mWidth *mHeight*2;
        //码率
        format.setInteger(MediaFormat.KEY_BIT_RATE, bitrate);
        //帧率
        format.setInteger(MediaFormat.KEY_FRAME_RATE, 30);
        //关键帧间隔-每秒关键帧数
        format.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, 1);

        //创建编码器
        mMediaCodec = MediaCodec.createEncoderByType(MediaFormat.MIMETYPE_VIDEO_AVC);
        //配置编码器
        mMediaCodec.configure(format, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE);

2,然后调用start()方法开启,从输入队列塞入待编码数据
视频直接从Surface中获取待编码数据

        //这个surface显示的内容就是要编码的画面
        mSurface = mMediaCodec.createInputSurface();

音频则通过AudioRecord采集到的pcm数据,塞入到输入队列中

            int buffIndex = mAudioCodec.dequeueInputBuffer(0);
            presentationTimeUs += (long) (1.0 * buffSize / (sampleRate * channelCount * (audioFormat / 8)) * 1000000.0);
            Log.d(TAG, "pcm一帧时间戳 = " + presentationTimeUs / 1000000.0f);
            mAudioCodec.queueInputBuffer(buffIndex, 0, buffSize, presentationTimeUs, 0);

塞入pcm音频数据时,需要进行音频时间戳的计算。时间戳的单位是微秒。
PCM文件大小=采样率x采样时间x(采样位深/8)x通道数(Bytes)
例如:
数据量Byte= 44100Hz×(16/8)×2×10s=1764 KByte
所以倒转过来,时间戳(时长)计算就是:
presentationTimeUs = (totalBytes / sampleRate/ audioFormat / channelCount / 8 )x100000
最后乘以1000000,转化成微秒。

3,从输出队列中获得编码后的数据

int outputBufferIndex = mAudioCodec.dequeueOutputBuffer(bufferInfo, 0);
if (outputBufferIndex == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED) {
// 通过MediaMuxer添加音轨/视频轨

}else{
  while (outputBufferIndex >= 0) {
    ByteBuffer outputBuffer = mAudioCodec.getOutputBuffer(outputBufferIndex);
     outputBuffer.position(bufferInfo.offset);
     outputBuffer.limit(bufferInfo.offset + bufferInfo.size);

      if (pts == 0) {
               pts = bufferInfo.presentationTimeUs;
       }
      bufferInfo.presentationTimeUs = bufferInfo.presentationTimeUs - pts;
// 音视频合成
      mMuxer.writeSampleData(mCodecState.audioTrackIndex, outputBuffer, bufferInfo);

      mAudioCodec.releaseOutputBuffer(outputBufferIndex, false);
      outputBufferIndex = mAudioCodec.dequeueOutputBuffer(bufferInfo, 0);
  }
}

通过MediaCodec的dequeueOutputBuffer从输出队列中获取编码后的音视频数据。然后通过MediaMuxer进行音视频的合成。

四、音视频的合成

在Android中,可以使用MediaMuxer来封装编码后的视频流和音频流到mp4容器中,MediaMuxer最多仅支持一个视频track和一个音频track。

MediaMuxer的使用必须严格遵循如下顺序:
创建MediaMuxer->addTrack->start->writeSampleData->stop->release
对于音视频的合成,需要当音频和视频track都addTrack之后,才能调用start。
如果顺序不对,或者多次调用start、stop、release,都会导致IllegalStateException。

使用MediaMuxer开发时,可能会经常遇到类似如下错误。Muxer的状态Illegal错误。

java.lang.IllegalStateException: Muxer is not initialized.
    at android.media.MediaMuxer.addTrack(MediaMuxer.java:617)
    at com.example.dj.record.MediaRecorder.codec(MediaRecorder.java:163)

可能的场景是在两个不同的Thread中分别执行音视频的录制+编码,所以需要等待两个线程都执行完addTrack之后,再执行start

代码:
https://github.com/godtrace12/DOpenglTest.git
参考:https://blog.csdn.net/qq_34760508/article/details/107045337
https://juejin.cn/post/6844903904488996878
https://www.jianshu.com/p/01b374acd6a4
https://blog.csdn.net/gb702250823/article/details/81627503
https://blog.csdn.net/u010126792/article/details/86580878/
https://www.pianshen.com/article/2768765911/
https://blog.csdn.net/liuyizhou95/article/details/89553013

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容