0%

opencv_5_几何变换

  • 几何变换是指将一幅图像映射到另外一幅图像内的操作。opencv提供了多个与映射有关的函数,这些函数使用起来方便灵活,能够高效地完成图像的映射。

缩放

  • dst = cv2.resize(src, dsize[,fx[,fy[,interpolation]]])
  • 式中:
  • dst:代表输出的目标图像,该图像的类型与src相同,其大小为dsize(当该值非零时),或者可以通过src.size()、fx、fy计算得到。
  • src:代表需要缩放的原始图像
  • dsize:代表输出图像大小
  • fx:代表水平方向的缩放比例。
  • fy:代表垂直方向的缩放比例。
  • interpolation代表插值方式。

案例1:设置程序,使用函数cv2.resize()对一个数组进行简单缩放。

1
2
3
4
5
6
7
8
9
10
import cv2
import numpy as np

img = np.ones([2,4,3], dtype=np.uint8)
size = img.shape[:2]
rst = cv2.resize(img, size)
print('img shape=\n', img.shape)
print('img=\n', img)
print('rst shape=\n', rst.shape)
print('rst=\n', rst)
img shape=
 (2, 4, 3)
img=
 [[[1 1 1]
  [1 1 1]
  [1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]
  [1 1 1]
  [1 1 1]]]
rst shape=
 (4, 2, 3)
rst=
 [[[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]

 [[1 1 1]
  [1 1 1]]]

通过以上例题我们进一步确认:cv2.resize() 内dsize参数与图像shape属性在行、列的顺序是不一致的。

案例2:设置程序,使用函数cv2.resize()完成一个简单的图像缩放

1
2
3
4
5
6
7
8
9
import cv2
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
size = (int(cols*0.9), int(rows*0.5)) # 宽度缩小0.9倍,高度缩小0.5倍
rst = cv2.resize(img, size)
get_show(img)
get_show(rst)

png

png

案例3:设置程序,控制函数cv2.resize()的fx参数、fy参数,完成图像缩放

1
2
3
4
5
6
import cv2

img = cv2.imread('data/angle.jpg')
rst = cv2.resize(img, None, fx=2, fy=0.5) # 宽度变为原来的两倍,高度变为原来的一半
get_show(img)
get_show(rst)

png

png

翻转

  • dst = cv2.flip(src, flipcode)
  • 式中:
  • dst:代表和原始图像具有同样大小、类型的目标图像。
  • src:代表要处理的原始图像。
  • flipCode:代表旋转类型。0:绕着x轴翻转;正数:绕着y轴翻转;负数:围绕x轴、y轴同时翻转
1
2
3
4
5
6
import cv2

img = cv2.imread('data/angle.jpg')
x = cv2.flip(img, 0) # 围绕x轴翻转
y = cv2.flip(img, 1) # 围绕y轴翻转
xy = cv2.flip(img, -1) # 围绕x轴y轴同时翻转
1
get_show(img, x, y, xy)

png

仿射

  • 仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。该变换能够保持图像的平直性和平行性。平直性是指图像经过仿射变换后,直线仍然是直线;平行性是指图像在万仿射变换后,平行线仍然是平行线。
  • opencv中的仿射变换函数为cv2.warpAffine(),其通过一个变换矩阵(映射矩阵)M实现变换,具体为:
  • dst(x,y)=src(M11x+M12y+M13, M21x+M22y+M23)
  • dst = cv2.warpAffine(sec, M, dsize[,flags[,borderMode[,borderValue]]])
  • 式中:
  • dst:代表仿射后的输出图像,该图像的类型和原始图像的类型相同。dsize决定输出图像的实际大小。
  • src:代表要仿射的原始图像。
  • M:代表一个2×3的变换矩阵。使用不同的变换矩阵,就可以实现不同的仿射变换。
  • dsize:代表输出图像的尺寸大小
  • flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INTERSE_MAP,意味着M是逆变换类型,实现从目标图像dst到原始图像src的逆变换。
  • borderMode:代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
  • borderValue:代表边界值,默认是0。

平移

  • 将图像向右平移50, 然后向下平移100
  • M =
  • [[1, 0, x]
  • 0, 1, y]]
1
2
3
4
5
6
7
8
9
10
import cv2
import numpy as np

img = cv2.imread('data/angle.jpg')
height, width = img.shape[:2]
x = 50
y = 100
M = np.float32([[1,0,x], [0, 1, y]])
move = cv2.warpAffine(img, M, (width, height))
get_show(img, move)


png

旋转

  • 在使用函数cv2.warpAffine()对图像进行旋转时,可以通过函数cv2.getRotationMatrix2D()获取转换矩阵。
  • retval = cv2.getRotationMatrix2D(center, angle, scale)
  • 式中:
  • center:为旋转的中心点。
  • angle:为旋转角度,正数表示逆时针旋转,负数表示顺时针旋转。
  • scale:为变换尺度(缩放大小)。

以图像中心为圆点,逆时针旋转45度,并将目标图像缩小为原始图像的0.5倍

1
2
3
4
5
6
7
8
import cv2
import numpy as np

img = cv2.imread('data/angle.jpg')
height, weight = img.shape[:2]
M = cv2.getRotationMatrix2D((weight/2, height/2), 45, 0.5)
rotation = cv2.warpAffine(img, M, (weight, height))
get_show(img, rotation)


png

更复杂的仿射变换

  • 对于更复杂的仿射变换,opencv提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。
  • 该函数的语法格式为:
  • retval = cv2.getAffineTransform(src, dst)
  • 式中:
  • src:代表输入图像的三个点坐标
  • dst:代表输出图像的三个点坐标
1
2
3
4
5
6
7
8
9
import cv2

img = cv2.imread('data/angle.jpg')
rows, cols, ch = img.shape
p1 = np.float32([[0,0], [cols-1,0], [0, rows-1]])
p2 = np.float32([[0, rows*0.33], [cols*0.85, rows*0.2], [cols*0.1, rows*0.85]])
M = cv2.getAffineTransform(p1, p2)
rarote = cv2.warpAffine(img, M, (cols, rows))
get_show(img, rarote)

png

透视

  • 仿射变换只能将矩形转换为平行四边形,而透视变换可以将矩形映射为任意四边形
  • 透视变换通过函数cv2.warpPerspective()实现
  • dst = cv2.warpPerspective(src,M,dsize[,flags[.borderMode[,borderValue]]])
  • 式中:
  • dst:代表透视处理后的输出图像,该图像和原始图像具有相同的类型。dsize决定输出图像的实际大小
  • src:代表原始图像
  • M:代表一个3×3的变换矩阵。
  • dsize:代表输出图像的尺寸大小
  • flags:代表插值方法
  • borderMode:代表边类型
  • borderValue:代表边界值,默认是0

  • 与仿射变换一样,同样可以使用一个函数来生成函数cv2.warpPerspective()所使用的转换矩阵。

  • 该函数是cv2.getPerspectiveTransform(),其语法格式为:
  • retval=cv2.getPerspectiveTransform(src,dst)
  • 式中:
  • src:代表输入图像的四个顶点的坐标
  • dst:代表输出图像的四个顶点的坐标

  • 注意:此处的src和dst与仿射变换的cv2.getAffineTransform()中的不同,此处为四个点的坐标

1
2
3
4
5
6
7
8
9
10
11
12
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/dog.jpg')
rows, cols = img.shape[:2]
print(rows, cols)
pst1 = np.float32([[0,0], [rows-1, 0], [0, cols-1], [rows-1, cols-1]])
pst2 = np.float32([[50,0], [rows*0.8, 0], [0, cols*0.8], [rows*0.8, cols*0.8]])
M = cv2.getPerspectiveTransform(pst1, pst2)
toushi = cv2.warpPerspective(img, M, (cols, rows))
get_show(img, toushi)
300 534

png

重映射

  • 把一幅图像内的像素点放置到另外一幅图像内的指定位置,这个过程称为重映射
  • dst = cv2.remap(src, map1, map2,interpolation[,borderMpde[,borderValue]])
  • 式中:
  • dst:代表目标图像,它和src具有相同的大小和类型
  • src:代表原始图像
  • map1参数有两种可能的值:
  • -表示(x,y)点的一个映射
  • -表示CV_16SC2, CV_32FC1,CV_32FC2类型(x,y)点的x值
  • map2参数同样有两种可能的值:
  • -当map1表示(x,y)时,该值为空。
  • -当map1表示(x,y)点的x值时,该值是CV_16SC2, CV_32FC1类型(x,y)点的y值。
  • Interprolation代表插值方式,这里不支持INTER_AREA方法
  • borderMode:边界模式
  • borderValue:边界值,默认为0

如果想将目标图像(映射结果图像)中所有像素点都映射为原始图像内处于第0行第3列上的像素点B,那么需要将参数map1内的值均设为3,将参数map2内的值均设为0

映射参数的理解

1
2
3
4
5
6
7
8
9
10
11
12
import cv2
import numpy as np

img = np.random.randint(0, 256, size=[4,5], dtype=np.uint8)
rows, cols = img.shape
mapx = np.ones(img.shape, np.float32)*3
mapy = np.ones(img.shape, np.float32)*0
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
print("img=\n", img)
print("mapx=\n", mapx)
print("mapy=\n", mapy)
print("rst=\n", rst)
img=
 [[193 222 113 149  90]
 [ 21 246 240 100 147]
 [ 18 224 128  36 217]
 [ 68 108 220 114 195]]
mapx=
 [[3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]]
mapy=
 [[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
rst=
 [[149 149 149 149 149]
 [149 149 149 149 149]
 [149 149 149 149 149]
 [149 149 149 149 149]]

复制

  • 将参数进行如下处理:
  • 将map1的值设定为对应位置上的x轴坐标值
  • 将map2的值设定为对应位置上的y轴坐标值
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
mapx[i,j] = j
mapy[i,j] = i
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

绕x轴旋转

  • 如果想让图像绕着x轴翻转,意味着在映射过程中:
  • x坐标轴的值保持不变。
  • y坐标轴的值为对称轴进行变换
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
mapx[i,j] = j
mapy[i,j] = rows-i-1
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

绕y轴翻转

  • 绕y轴翻转意味着,在映射过程中:
  • y坐标轴不变
  • x坐标轴的值以y轴为对称轴进行交换
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
mapx[i,j] = cols-j-1
mapy[i,j] = i
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

绕x轴、y轴翻转

  • 意味着在映射过程中:
  • x坐标轴的值以y轴为对称轴进行交换
  • y坐标轴的值以x轴为对称轴进行交换
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
mapx[i,j] = cols-j-1
mapy[i,j] = rows-i-1
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

x轴、y轴互换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
mapx[i,j] = i
mapy[i,j] = j
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

图像缩放

  • 缩小图像后,可以将图像固定在围绕其中心的某个区域。
  • 例如:
  • 在目标图像的x轴(0.25x轴长度,0.75x轴长度)区间内生成缩小图像;x轴其余区域的点取样自x轴上任意一点的值。
  • 在目标图像的y轴(0.25y轴长度,0.75y轴长度)区间内生成缩小图像;y轴其余区域的点取样自y轴上任意一点的值。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import cv2
import numpy as np
from get_show_img import get_show

img = cv2.imread('data/angle.jpg')
rows, cols = img.shape[:2]
mapx = np.zeros([rows, cols], dtype=np.float32)
mapy = np.zeros([rows, cols], dtype=np.float32)
for i in range(rows):
for j in range(cols):
if 0.25*cols<i<0.75*cols and 0.25*rows<j<0.75*rows:
mapx[i,j] = 2*(j-0.25*cols)+0.5
mapy[i,j] = 2*(i-0.25*rows)+0.5
else:
mapx[i,j] = 0
mapy[i,j] = 0
rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR)
get_show(img, rst)

png

-------------本文结束感谢您的阅读-------------