欢迎关注公众号:Romi的杂货铺,这里有更多python相关的好康的~
在这篇文章中,我们将使用Python下载视频,并将普通的视频转化为的代码版本的视频,效果如下:
首先我们需要获取网页上的视频。一般情况下通过APP或者网页上的视频下载的问题有:
1.没有提供下载按钮导致无法下载
2.下载后的格式一般为.flv格式,或者是有自己的格式无法解析(例如B站)
针对第一个问题,我们的解决办法就是Python中的you_get库.You-Get 只需要一行代码就可以便利的下载网络上的媒体信息
you_get下载视频
you_get主页:https://github.com/soimort/you-get
中文说明文档:https://github.com/soimort/you-get/wiki/%E4%B8%AD%E6%96%87%E8%AF%B4%E6%98%8E
首先依旧是需要安装you-get库,同时还需要安装FFmpeg,这个工具是you-get库的必要依赖,同时也会在其他的地方用到。本篇文章提供的FFmpeg地址为解压免安装版本,下载后解压并记一下文件路径。其他
安装完成后如果想下载某个网页的视频,,只需要一句简单的 you-get+网址即可下载视频.
$ you-get http://www.fsf.org/blogs/rms/20140407-geneva-tedx-talk-free-software-free-society
Site: fsf.org
Title: TEDxGE2014_Stallman05_LQ
Type: WebM video (video/webm)
Size: 27.12 MiB (28435804 Bytes)
Downloading TEDxGE2014_Stallman05_LQ.webm ...
100.0% ( 27.1/27.1 MB) ├████████████████████████████████████████┤[1/1] 12 MB/s
需要注意一点,上述例子you_get的基本命令是在cmd中输入的命令行,如果我们使用IDE时需要使用os.system()方法来执行cmd命令
import os
os.system('you-get http://www.fsf.org/blogs/rms/20140407-geneva-tedx-talk-free-software-free-society')
在一下的you_get示例中,所有的代码均为cmd的代码,所以使用IDE的同学记得要在代码前加入os.system()函数以保证正确运行。
在下载前可以使用 --info/-i 以查看所有可用画质与格式:
$ you-get -i 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
site: YouTube
title: Me at the zoo
streams: # Available quality and codecs
[ DEFAULT ] _________________________________
- itag: 43
container: webm
quality: medium
size: 0.5 MiB (564215 bytes)
# download-with: you-get --itag=43 [URL]
- itag: 18
container: mp4
quality: medium
# download-with: you-get --itag=18 [URL]
- itag: 5
container: flv
quality: small
# download-with: you-get --itag=5 [URL]
- itag: 36
container: 3gp
quality: small
# download-with: you-get --itag=36 [URL]
- itag: 17
container: 3gp
quality: small
# download-with: you-get --itag=17 [URL]
标有DEFAULT 为默认画质。使用上述下载语句即可开始下载默认画质的视频
如果希望下载其他格式或画质的视频,使用提示中出现的 # download-with: 选项即可。例如我想下载上述示例中的MP4格式的视屏:
$ you-get --itag=18 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
当下载视频遇到问题时:
- 一是排除网络问题;
- 二是确保you-get更新到最新版本;
- 三是检查目标视频是否已经确认无法爬取。
- 四--debug参数进行调试
同时可以使用--output-dir/-o 设定路径, --output-filename/-O 设定输出文件名:
$ you-get -o ~/Videos -O zoo.webm 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
这样从网页上下载视频的问题就解决了!
视频格式转化
第二个问题就是从网页上下载视频的视频很只有flv格式,不利于预览和处理。因此需要转化视频格式,比如转化成MP4格式。但是一般在线频转化要么有视频大小的限制,要么需要下载app或者会员。这时候就要用到上面我们下载的FFmpeg处理视频
FFmpeg 是视频处理最常用的开源软件。它功能强大,用途广泛,大量用于视频网站和商业软件(比如 Youtube 和 iTunes),也是许多音频和视频格式的标准编码/解码实现。使用FFmpeg 命令行处理视频,比桌面视频处理软件更简洁高效。
例如我们想把所有的flv文件转化为mp4文件:
(本部分涉及cmd命令与FFmpeg 命令行,如有疑问可以先搜一下Windows cmd命令的用法和FFmpeg 命令行的用法)
- 1.解压后打开bin,把三个可执行文件复制到C:\Windows\system32
- 2.打开CMD,cd 到指定文件夹
- 3.执行cmd命令:
for %i in (*.flv) do ffmpeg -i “%i” -c copy “%~ni.mp4”
之后就可以发现所有的flv格式视频全部转化为了MP4格式。
转化代码版视频
之后就可以将普通的视频转化为代码版视频了。这里使用的代码原作者文章:https://www.cnblogs.com/TurboWay/p/9748535.html
使用方法:
一、环境准备
1.需要安装opencv,直接安装 pip install opencv-python
2.需要安装ffmpeg (上述步骤中已下载解压的可跳过),直接解压免安装,下载传送门;
3.将 ffmpeg.exe 的路径复制,替换代码开头的 ffmpeg = r'G:\ffmpeg\bin\ffmpeg.exe'
二、如何使用:
1.替换主函数里的vedio视频地址
2.运行程序即可
注意对存储空间的要求较高,请保证有足够的存储空间
代码如下:
# -*- coding:utf-8 -*-
# coding:utf-8
import os, cv2, subprocess, shutil
from cv2 import VideoWriter, VideoWriter_fourcc, imread, resize
from PIL import Image, ImageFont, ImageDraw
ffmpeg = r'D:\ffmpeg\bin\ffmpeg.exe'
code_color = (169,169,169) # 颜色RGB 默认灰色 ,'' 则彩色
# 像素对应ascii码
#ascii_char = list("$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!lI;:oa+>!:+. ")
#ascii_char = ['.',',',':',';','+','*','?','%','S','#','@'][::-1]
#ascii_char = list("MNHQ$OC67+>!:-. ")
ascii_char = list("MNHQ$OC67)oa+>!:+. ")
# 将像素转换为ascii码
def get_char(r, g, b, alpha=256):
if alpha == 0:
return ''
length = len(ascii_char)
gray = int(0.2126 * r + 0.7152 * g + 0.0722 * b)
unit = (256.0 + 1) / length
return ascii_char[int(gray / unit)]
# 将txt转换为图片
def txt2image(file_name):
im = Image.open(file_name).convert('RGB')
# gif拆分后的图像,需要转换,否则报错,由于gif分割后保存的是索引颜色
raw_width = im.width
raw_height = im.height
width = int(raw_width / 6)
height = int(raw_height / 15)
im = im.resize((width, height), Image.NEAREST)
txt = ""
colors = []
for i in range(height):
for j in range(width):
pixel = im.getpixel((j, i))
colors.append((pixel[0], pixel[1], pixel[2]))
if (len(pixel) == 4):
txt += get_char(pixel[0], pixel[1], pixel[2], pixel[3])
else:
txt += get_char(pixel[0], pixel[1], pixel[2])
txt += '\n'
colors.append((255, 255, 255))
im_txt = Image.new("RGB", (raw_width, raw_height), (255, 255, 255))
dr = ImageDraw.Draw(im_txt)
# font = ImageFont.truetype(os.path.join("fonts","汉仪楷体简.ttf"),18)
font = ImageFont.load_default().font
x = y = 0
# 获取字体的宽高
font_w, font_h = font.getsize(txt[1])
font_h *= 1.37 # 调整后更佳
# ImageDraw为每个ascii码进行上色
for i in range(len(txt)):
if (txt[i] == '\n'):
x += font_h
y = -font_w
# self, xy, text, fill = None, font = None, anchor = None,
# *args, ** kwargs
if code_color:
dr.text((y, x), txt[i], fill=code_color) # fill=colors[i]彩色
else:
dr.text((y, x), txt[i], fill=colors[i]) # fill=colors[i]彩色
# dr.text((y, x), txt[i], font=font, fill=colors[i])
y += font_w
name = file_name
# print(name + ' changed')
im_txt.save(name)
# 将视频拆分成图片
def video2txt_jpg(file_name):
vc = cv2.VideoCapture(file_name)
c = 1
if vc.isOpened():
r, frame = vc.read()
if not os.path.exists('Cache'):
os.mkdir('Cache')
os.chdir('Cache')
else:
r = False
while r:
cv2.imwrite(str(c) + '.jpg', frame)
txt2image(str(c) + '.jpg') # 同时转换为ascii图
r, frame = vc.read()
c += 1
os.chdir('..')
return vc
# 将图片合成视频
def jpg2video(outfile_name, fps):
fourcc = VideoWriter_fourcc(*"MJPG")
images = os.listdir('Cache')
im = Image.open('Cache/' + images[0])
vw = cv2.VideoWriter(outfile_name, fourcc, fps, im.size)
os.chdir('Cache')
for image in range(len(images)):
# Image.open(str(image)+'.jpg').convert("RGB").save(str(image)+'.jpg')
frame = cv2.imread(str(image + 1) + '.jpg')
vw.write(frame)
# print(str(image + 1) + '.jpg' + ' finished')
os.chdir('..')
vw.release()
# 调用ffmpeg获取mp3音频文件
def video2mp3(file_name, outfile_name):
cmdstr = " -i {0} -f mp3 {1} -y".format(file_name, outfile_name)
cmd(cmdstr)
# 合成音频和视频文件
def video_add_mp3(file_name, mp3_file,outfile_name):
cmdstr = " -i {0} -i {1} -strict -2 -f mp4 {2} -y".format(file_name, mp3_file, outfile_name)
cmd(cmdstr)
# 视频截取
def vediocut(file_name, outfile_name, start, end):
cmdstr = " -i {0} -vcodec copy -acodec copy -ss {1} -to {2} {3} -y".format(file_name,start,end,outfile_name)
cmd(cmdstr)
# 执行脚本命令
def cmd(cmdstr):
cmdstr = ffmpeg + cmdstr
response = subprocess.call(cmdstr, shell=True, creationflags=0x08000000)
if response == 1:
print("ffmpeg脚本执行失败,请尝试手动执行:{0}".format(cmdstr))
# 主函数
def main(vedio, save=False, iscut=False, start='00:00:00', end='00:00:14'):
"""
:param vedio: 原视频文件地址
:param save: 是否保存临时文件 默认不保存
:param iscut: 是否先对原视频做截取处理 默认不截取
:param start: 视频截取开始时间点 仅当iscut=True时有效
:param end: 视频截取结束时间点 仅当iscut=True时有效
:return: 输出目标视频文件 vedio.split('.')[0] + '-code.mp4'
"""
file_cut = vedio.split('.')[0] + '_cut.mp4'
file_mp3 = vedio.split('.')[0] + '.mp3'
file_temp_avi = vedio.split('.')[0] + '_temp.avi'
outfile_name = vedio.split('.')[0] + '-code.mp4'
print("开始生成...")
if iscut:
print("正在截取视频...")
vediocut(vedio, file_cut, start, end)
vedio = file_cut
print("正在转换代码图片...")
vc = video2txt_jpg(vedio) # 视频转图片,图片转代码图片
FPS = vc.get(cv2.CAP_PROP_FPS) # 获取帧率
vc.release()
print("正在分离音频...")
video2mp3(vedio, file_mp3) # 从原视频分离出 音频mp3
print("正在转换代码视频...")
jpg2video(file_temp_avi, FPS) #代码图片转视频
print("正在合成目标视频...")
video_add_mp3(file_temp_avi, file_mp3, outfile_name) # 将音频合成到代码视频
if (not save): # 移除临时文件
print("正在移除临时文件...")
shutil.rmtree("Cache")
for file in [file_cut, file_mp3, file_temp_avi]:
if os.path.exists(file):
os.remove(file)
print("生成成功:{0}".format(outfile_name))
if __name__ == '__main__':
vedio = r"test.mp4"
main(vedio, save=False, iscut=False, start='00:00:00', end='00:00:14')
这样就可以将一个视频转化为代码版的视频了!