kongen kongen
首页
导航站
  • 学习教程

    • Opencv教程
    • C++基础教程
    • C++_Primer教程
    • CUDA编程
  • Opencv
  • CNN
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 面试题库

    • HTML
    • CSS
    • jQuery
    • Vue
    • 零碎
  • 面试心得

    • 杂言碎语
  • 十架道路

    • 十架七言系列
    • 基督徒生活观
    • 上帝的蓝图
  • 摘抄收录

    • ☆ 励志鸡汤
    • ❀ 人间烟火
  • 读书笔记

    • 《小狗钱钱》
    • 《穷爸爸富爸爸》
    • 《聪明人使用方格笔记本》
  • 学习
  • 面试
  • 心情杂货
  • 友情链接
关于
  • 网站
  • 资源
  • Vue资源
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Kongen

你好呀(✪ω✪)
首页
导航站
  • 学习教程

    • Opencv教程
    • C++基础教程
    • C++_Primer教程
    • CUDA编程
  • Opencv
  • CNN
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 面试题库

    • HTML
    • CSS
    • jQuery
    • Vue
    • 零碎
  • 面试心得

    • 杂言碎语
  • 十架道路

    • 十架七言系列
    • 基督徒生活观
    • 上帝的蓝图
  • 摘抄收录

    • ☆ 励志鸡汤
    • ❀ 人间烟火
  • 读书笔记

    • 《小狗钱钱》
    • 《穷爸爸富爸爸》
    • 《聪明人使用方格笔记本》
  • 学习
  • 面试
  • 心情杂货
  • 友情链接
关于
  • 网站
  • 资源
  • Vue资源
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • OpenCV简介

  • OpenCV中的 Gui特性

  • 核心操作

    • 图像的基本操作
      • 目标:
      • 获取并修改图像的像素值
      • 获取图像的属性
      • 图像ROI
      • 图像通道的拆分和合并
      • 制作图像边框(padding)
    • 图像的算术运算
    • 绩效评估和改进技术
  • OpenCV中的图像处理

  • 特征检测和描述

  • 视频分析

  • 相机校准和3D重建

  • 机器学习

  • 计算摄影

  • 目标检测

  • Opencv基础原理
  • 核心操作
kongen
2019-06-11
目录

图像的基本操作

# 目标:

  • 获取并修改图像的像素值
  • 获取图像的属性
  • 设置感兴趣区域(ROI)
  • 图像的拆分和合并 本节中的几乎所有操作主要与Numpy有关,而不是和OpenCV有关。使用OpenCV编写更好的优化代码需要先熟悉Numpy

注意:示例将在Python终端中显示,因为大多数只是单行代码

# 获取并修改图像的像素值

首先我们先加载一张彩色图像:

>>> import numpy as np
>>> import cv2 as cv

>>> img = [cv.imread](('messi5.jpg')
1
2
3
4

你可以通过行和列的坐标值获取该像素点的像素值。对于BGR图像,它返回一个蓝色,绿色,红色值的数组。对于灰度图像,仅返回相应的强度值。

>>> px = img[100,100]
>>> print( px )
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print( blue )
157
1
2
3
4
5
6
7
8

你可以用同样的方法修改像素点的像素值:

>>> img[100,100] = [255,255,255]
>>> print( img[100,100] )
[255 255 255]
1
2
3

注意:Numpy是一个用于快速阵列计算的优化库。因此,简单地访问每个像素值并对其进行修改将非常缓慢,并且不推荐这样做。 上述方法通常用于选择数组的区域,比如前5行和后3列。对于单个像素访问,Numpy数组方法array.item()和array.itemset()被认为是更好的选择,但它们总是返回标量。如果要获取所有B,G,R值,则需要单独调用array.item()。

更好的像素获取和编辑方法:

# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100
1
2
3
4
5
6
7
8

# 获取图像的属性

图像属性包括行数,列数和通道数,图像数据类型,像素数等。

使用img.shape可以获取图像的形状。它返回一组行,列和通道的元组(如果图像是彩色的):

>>> print( img.shape )
(342, 548, 3)
1
2

注意:如果图像是灰度图像,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的一种很好的方法。

使用img.size获取的像素总数:

>>> print( img.size )
562248
1
2

使用img.dtype获取图像数据类型:

>>> print( img.dtype )
uint8
1
2

注意:img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。

# 图像ROI

有时你需要对一幅图像的特定区域进行操作。例如我们要检测一副图像中眼睛的位置,我们首先应该在图像中找到脸,再在脸的区域中找眼睛,而不是直接在一整幅图像中搜索。这样会提高程序的准确性(因为眼睛总在脸上)和性能(因为我们在很小的区域内搜索)。 ROI 也是使用 Numpy 索引来获得的。现在我们选择球的部分并把他拷贝到图像的其他区域。

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball
1
2

窗口将如下图所示:

image1

# 图像通道的拆分和合并

有时您需要分别处理图像的B、G、R通道。在这种情况下,需要将BGR图像分割为单个通道。或者在其他情况下,可能需要将这些单独的通道合并到BGR图像。你可以通过以下方式完成:

>>> b,g,r = cv.split(img)
>>> img = cv.merge((b,g,r))
1
2

或者:

>>> b = img[:,:,0]
1

假设你要将所有红色像素设置为零,则无需先拆分通道。使用Numpy索引更快:

>>> img[:,:,2] = 0
1

注意:cv.split()是一项代价高昂的操作(就消耗时间而言)。所以只有在你需要时才这样做。否则使用Numpy索引。

# 制作图像边框(padding)

如果要在图像周围创建边框,比如相框,可以使用cv.copyMakeBorder()。它在卷积运算,零填充等方面有更多的应用。该函数需要以下参数:

  • src - 输入图像
  • top, bottom, left, right - 对应边界的像素数目。
  • borderType - 要添加那种类型的边界,类型如下:
    • cv2.BORDER_CONSTANT - 添加一个固定的彩色边框,还需要下一个参数(value)。
    • cv2.BORDER_REFLECT - 边界元素的镜像。比如: fedcba|abcdefgh|hgfedcb
    • cv2.BORDER_REFLECT_101 or cv2.BORDER_DEFAULT - 跟上面一样,但稍作改动。例如: gfedcb|abcdefgh|gfedcba
    • cv2.BORDER_REPLICATE 重复最后一个元素。例如: aaaaaa|abcdefgh|hhhhhhh
    • cv2.BORDER_WRAP - 不知道怎么说了, 就像这样: cdefgh|abcdefgh|abcdefg
  • value 边界颜色,如果边界的类型是 cv2.BORDER_CONSTANT

下面是一个示例代码,演示了所有这些边框类型,以便更好地理解:

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255,0,0]

img1 = cv.imread('opencv-logo.png')

replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
constant=cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

窗口将如下图所示(图像与matplotlib一起显示。因此RED和BLUE通道将互换): image2

编辑 (opens new window)
用滑动条做调色板
图像的算术运算

← 用滑动条做调色板 图像的算术运算→

最近更新
01
附录L_CUDA底层驱动API
02-08
02
附录K_CUDA计算能力
02-08
03
附录J纹理获取
02-08
更多文章>
Theme by Vdoing | Copyright © 2024-2025 Kongen | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×