缩放
- dst = cv2.resize(src, dsize[,fx[,fy[,interpolation]]])
- 式中:
- dst:代表输出的目标图像,该图像的类型与src相同,其大小为dsize(当该值非零时),或者可以通过src.size()、fx、fy计算得到。
- src:代表需要缩放的原始图像
- dsize:代表输出图像大小
- fx:代表水平方向的缩放比例。
- fy:代表垂直方向的缩放比例。
- interpolation代表插值方式。
案例1:设置程序,使用函数cv2.resize()对一个数组进行简单缩放。
1 2 3 4 5 6 7 8 9 10
| import cv2 import numpy as np
img = np.ones([2,4,3], dtype=np.uint8) size = img.shape[:2] rst = cv2.resize(img, size) print('img shape=\n', img.shape) print('img=\n', img) print('rst shape=\n', rst.shape) print('rst=\n', rst)
|
img shape=
(2, 4, 3)
img=
[[[1 1 1]
[1 1 1]
[1 1 1]
[1 1 1]]
[[1 1 1]
[1 1 1]
[1 1 1]
[1 1 1]]]
rst shape=
(4, 2, 3)
rst=
[[[1 1 1]
[1 1 1]]
[[1 1 1]
[1 1 1]]
[[1 1 1]
[1 1 1]]
[[1 1 1]
[1 1 1]]]
通过以上例题我们进一步确认:cv2.resize() 内dsize参数与图像shape属性在行、列的顺序是不一致的。
案例2:设置程序,使用函数cv2.resize()完成一个简单的图像缩放
1 2 3 4 5 6 7 8 9
| import cv2 from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] size = (int(cols*0.9), int(rows*0.5)) rst = cv2.resize(img, size) get_show(img) get_show(rst)
|
案例3:设置程序,控制函数cv2.resize()的fx参数、fy参数,完成图像缩放
1 2 3 4 5 6
| import cv2
img = cv2.imread('data/angle.jpg') rst = cv2.resize(img, None, fx=2, fy=0.5) get_show(img) get_show(rst)
|
翻转
- dst = cv2.flip(src, flipcode)
- 式中:
- dst:代表和原始图像具有同样大小、类型的目标图像。
- src:代表要处理的原始图像。
- flipCode:代表旋转类型。0:绕着x轴翻转;正数:绕着y轴翻转;负数:围绕x轴、y轴同时翻转
1 2 3 4 5 6
| import cv2
img = cv2.imread('data/angle.jpg') x = cv2.flip(img, 0) y = cv2.flip(img, 1) xy = cv2.flip(img, -1)
|
仿射
- 仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。该变换能够保持图像的平直性和平行性。平直性是指图像经过仿射变换后,直线仍然是直线;平行性是指图像在万仿射变换后,平行线仍然是平行线。
- opencv中的仿射变换函数为cv2.warpAffine(),其通过一个变换矩阵(映射矩阵)M实现变换,具体为:
- dst(x,y)=src(M11x+M12y+M13, M21x+M22y+M23)
- dst = cv2.warpAffine(sec, M, dsize[,flags[,borderMode[,borderValue]]])
- 式中:
- dst:代表仿射后的输出图像,该图像的类型和原始图像的类型相同。dsize决定输出图像的实际大小。
- src:代表要仿射的原始图像。
- M:代表一个2×3的变换矩阵。使用不同的变换矩阵,就可以实现不同的仿射变换。
- dsize:代表输出图像的尺寸大小
- flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INTERSE_MAP,意味着M是逆变换类型,实现从目标图像dst到原始图像src的逆变换。
- borderMode:代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
- borderValue:代表边界值,默认是0。
平移
- 将图像向右平移50, 然后向下平移100
- M =
- [[1, 0, x]
- 0, 1, y]]
1 2 3 4 5 6 7 8 9 10
| import cv2 import numpy as np
img = cv2.imread('data/angle.jpg') height, width = img.shape[:2] x = 50 y = 100 M = np.float32([[1,0,x], [0, 1, y]]) move = cv2.warpAffine(img, M, (width, height)) get_show(img, move)
|
旋转
- 在使用函数cv2.warpAffine()对图像进行旋转时,可以通过函数cv2.getRotationMatrix2D()获取转换矩阵。
- retval = cv2.getRotationMatrix2D(center, angle, scale)
- 式中:
- center:为旋转的中心点。
- angle:为旋转角度,正数表示逆时针旋转,负数表示顺时针旋转。
- scale:为变换尺度(缩放大小)。
以图像中心为圆点,逆时针旋转45度,并将目标图像缩小为原始图像的0.5倍
1 2 3 4 5 6 7 8
| import cv2 import numpy as np
img = cv2.imread('data/angle.jpg') height, weight = img.shape[:2] M = cv2.getRotationMatrix2D((weight/2, height/2), 45, 0.5) rotation = cv2.warpAffine(img, M, (weight, height)) get_show(img, rotation)
|
更复杂的仿射变换
- 对于更复杂的仿射变换,opencv提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。
- 该函数的语法格式为:
- retval = cv2.getAffineTransform(src, dst)
- 式中:
- src:代表输入图像的三个点坐标
- dst:代表输出图像的三个点坐标
1 2 3 4 5 6 7 8 9
| import cv2
img = cv2.imread('data/angle.jpg') rows, cols, ch = img.shape p1 = np.float32([[0,0], [cols-1,0], [0, rows-1]]) p2 = np.float32([[0, rows*0.33], [cols*0.85, rows*0.2], [cols*0.1, rows*0.85]]) M = cv2.getAffineTransform(p1, p2) rarote = cv2.warpAffine(img, M, (cols, rows)) get_show(img, rarote)
|
透视
1 2 3 4 5 6 7 8 9 10 11 12
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/dog.jpg') rows, cols = img.shape[:2] print(rows, cols) pst1 = np.float32([[0,0], [rows-1, 0], [0, cols-1], [rows-1, cols-1]]) pst2 = np.float32([[50,0], [rows*0.8, 0], [0, cols*0.8], [rows*0.8, cols*0.8]]) M = cv2.getPerspectiveTransform(pst1, pst2) toushi = cv2.warpPerspective(img, M, (cols, rows)) get_show(img, toushi)
|
300 534
重映射
- 把一幅图像内的像素点放置到另外一幅图像内的指定位置,这个过程称为重映射
- dst = cv2.remap(src, map1, map2,interpolation[,borderMpde[,borderValue]])
- 式中:
- dst:代表目标图像,它和src具有相同的大小和类型
- src:代表原始图像
- map1参数有两种可能的值:
- -表示(x,y)点的一个映射
- -表示CV_16SC2, CV_32FC1,CV_32FC2类型(x,y)点的x值
- map2参数同样有两种可能的值:
- -当map1表示(x,y)时,该值为空。
- -当map1表示(x,y)点的x值时,该值是CV_16SC2, CV_32FC1类型(x,y)点的y值。
- Interprolation代表插值方式,这里不支持INTER_AREA方法
- borderMode:边界模式
- borderValue:边界值,默认为0
如果想将目标图像(映射结果图像)中所有像素点都映射为原始图像内处于第0行第3列上的像素点B,那么需要将参数map1内的值均设为3,将参数map2内的值均设为0
映射参数的理解
1 2 3 4 5 6 7 8 9 10 11 12
| import cv2 import numpy as np
img = np.random.randint(0, 256, size=[4,5], dtype=np.uint8) rows, cols = img.shape mapx = np.ones(img.shape, np.float32)*3 mapy = np.ones(img.shape, np.float32)*0 rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) print("img=\n", img) print("mapx=\n", mapx) print("mapy=\n", mapy) print("rst=\n", rst)
|
img=
[[193 222 113 149 90]
[ 21 246 240 100 147]
[ 18 224 128 36 217]
[ 68 108 220 114 195]]
mapx=
[[3. 3. 3. 3. 3.]
[3. 3. 3. 3. 3.]
[3. 3. 3. 3. 3.]
[3. 3. 3. 3. 3.]]
mapy=
[[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]]
rst=
[[149 149 149 149 149]
[149 149 149 149 149]
[149 149 149 149 149]
[149 149 149 149 149]]
复制
- 将参数进行如下处理:
- 将map1的值设定为对应位置上的x轴坐标值
- 将map2的值设定为对应位置上的y轴坐标值
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): mapx[i,j] = j mapy[i,j] = i rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|
绕x轴旋转
- 如果想让图像绕着x轴翻转,意味着在映射过程中:
- x坐标轴的值保持不变。
- y坐标轴的值为对称轴进行变换
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): mapx[i,j] = j mapy[i,j] = rows-i-1 rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|
绕y轴翻转
- 绕y轴翻转意味着,在映射过程中:
- y坐标轴不变
- x坐标轴的值以y轴为对称轴进行交换
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): mapx[i,j] = cols-j-1 mapy[i,j] = i rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|
绕x轴、y轴翻转
- 意味着在映射过程中:
- x坐标轴的值以y轴为对称轴进行交换
- y坐标轴的值以x轴为对称轴进行交换
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): mapx[i,j] = cols-j-1 mapy[i,j] = rows-i-1 rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|
x轴、y轴互换
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): mapx[i,j] = i mapy[i,j] = j rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|
图像缩放
- 缩小图像后,可以将图像固定在围绕其中心的某个区域。
- 例如:
- 在目标图像的x轴(0.25x轴长度,0.75x轴长度)区间内生成缩小图像;x轴其余区域的点取样自x轴上任意一点的值。
- 在目标图像的y轴(0.25y轴长度,0.75y轴长度)区间内生成缩小图像;y轴其余区域的点取样自y轴上任意一点的值。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| import cv2 import numpy as np from get_show_img import get_show
img = cv2.imread('data/angle.jpg') rows, cols = img.shape[:2] mapx = np.zeros([rows, cols], dtype=np.float32) mapy = np.zeros([rows, cols], dtype=np.float32) for i in range(rows): for j in range(cols): if 0.25*cols<i<0.75*cols and 0.25*rows<j<0.75*rows: mapx[i,j] = 2*(j-0.25*cols)+0.5 mapy[i,j] = 2*(i-0.25*rows)+0.5 else: mapx[i,j] = 0 mapy[i,j] = 0 rst = cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) get_show(img, rst)
|