视频入门

# 目标：

学习读取、显示和保存视频
用摄像头捕获并显示视频
学会使用函数：cv.VideoCapture(), cv.VideoWriter()

# 用摄像头捕获视频

通常，我们需要用摄像头来捕获直播画面，OpenCV为此提供了一些非常简单的函数接口。下面我们来尝试用摄像头来捕获视频画面（我使用的是电脑的内置摄像头）并将画面转化成灰度图像显示，这项操作很简单。如果要捕获视频，首先要做的是创建一个VideoCapture对象，它的参数可以是设备索引或者是视频文件的名称。设备索引就是指设备所对应的设备号，当只连接一个摄像头，参数只需传递0（或-1）。你可以传递参数1来选择你连接的第二个摄像头等等。接下来，你需要逐帧捕获并显示并不要忘记关闭捕获。

参考一下代码：

import numpy as np
import cv2 as cv

cap = cv.VideoCapture(0)

while(True):
    # Capture frame-by-frame
    ret, frame = cap.read()    

    # Our operations on the frame come here
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    # Display the resulting frame
    cv.imshow('frame',gray)
    if cv.waitKey(1) & 0xFF == ord('q'):
        break

# When everything done, release the capture
cap.release()
cv.destroyAllWindows()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

cap.read()返回一个bool值（True / False）。如果读取帧正确，则它将为True。因此，你可以通过值来确定视频的结尾。如果初始化摄像头失败，上面的代码会报错。你可以使用cap.isOpened()来检查是否初始化。如果返回值是True，说明初始化成功，否则就要使用函数 cap.open()。

你还可以使用cap.get(propld)方法访问此视频的某些功能，参数propId代表0到18之间的数字。每个数字表示视频的一个属性，详细的信息参见：cv::VideoCapture::get() (opens new window).其中一些值可以使用cap.set(propId，value)进行修改。其中参数value是你想要的新值。

例如，我可以通过cap.get(cv.CAP_PROP_FRAME_WIDTH)和cap.get(cv.CAP_PROP_FRAME_HEIGHT)分别检查帧宽和高度。它返回给我默认值640x480。但如果我想将其修改为320x240，只需使用ret=cap.set(cv.CAP_PROP_FRAME_WIDTH，32)和ret = cap.set(cv.CAP_PROP_FRAME_HEIGHT，240) 。

注意：如果收到报错信息，请确保其他使用摄像头的程序在正常工作（如Linux中的Cheese）。

# 播放视频文件

与从相机捕获视频原理相同，只需将设备索引更改为视频文件的名字。同时在显示帧时，请给cv.waitKey()函数传递适当的时间参数。如果它太小，视频将非常快，如果它太高，视频将会很慢。在正常情况下，25毫秒就可以了。

参考代码：

import numpy as np
import cv2 as cv

cap = cv.VideoCapture('vtest.avi')

while(cap.isOpened()):
    ret, frame = cap.read()

    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    cv.imshow('frame',gray)
    if cv.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv.destroyAllWindows()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

注意：确保已安装正确版本的ffmpeg或gstreamer。若使用Video Capture遇到麻烦，可能原因是错误安装了ffmpeg/gstreamer。

# 保存视频

目前为止我们可以捕获视频，并逐帧显示，现在我们希望保存该视频。保存图片很简单，但是对于视频，相对繁琐很多。首先创建一个VideoWriter对象，我们应该指定输出文件名（例如：output.avi），然后我们应该指定FourCC代码并传递每秒帧数（fps）和帧大小。最后一个是isColor标志，如果是True，则每一帧是彩色图像，否则每一帧是灰度图像。 FourCC是用于指定视频编解码器的4字节代码。可以在fourcc.org中找到可用代码列表，它取决于平台。以下编解码器对我来说是有用的：

在Fedora中：DIVX，XVID，MJPG，X264，WMV1，WMV2。（XVID更为可取.MJPG会产生高大小的视频.X264提供非常小的视频）
在Windows中：DIVX（更多要测试和添加）
在OSX中：MJPG（.mp4），DIVX（.avi），X264（.mkv）。

从相机捕获图像之后，在垂直方向上翻转每一帧之后逐帧保存。

参考代码：

import numpy as np
import cv2 as cv

cap = cv.VideoCapture(0)

# Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi',fourcc, 20.0, (640,480))

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret==True:
        frame = cv.flip(frame,0)

        # write the flipped frame
        out.write(frame)

        cv.imshow('frame',frame)
        if cv.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

# Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

编辑

← 图像入门 OpenCV中的绘图功能→