实现方式有以下几种可能:
1. 服务器端处理
通过服务器端对上传的视频进行分析处理,并将遮罩数据和视频一起保存,观看时下发给客户端
2. 客户端实时处理
应该不会把识别的工作量交给客户端,影响客户端耗电量
分析
https://www.bilibili.com/video/av32027812?from=search&seid=437509213727573140
这个视频说明遮罩的时候点选了另一个视频,用手机和电脑看完去是两种效果。
https://www.bilibili.com/video/av31056508?from=search&seid=563595165493288075
猜有可能视频的遮挡是实时进行的。另外并不只是头部被识别,很多运动功能的区域都被识别出来。
官方回答
一位 UP 主在科技区中投稿了个评测视频,我们在视频中发现其中“手机”这个元素在视频的 50% 以上时长都出现了,那么我们就可以认为手机应该也是视频主体内容的一部分。生成蒙版时自然就可以起到同样的效果。”
https://www.bilibili.com/read/cv534194
https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/81295289
机器学习
不断的机器学习识别,各种东西的图像都可以很好的被识别出来。