数据的使用 这里数据分为两部分。一部分只有video2wav,一共有48个文件夹,对应的是视频文件,还有两部分是对应的语音文件。 第二部分是人脸标准的文件,这里只有两部分,对应的标注,以及对应的视屏文件。