使用几何变换#

在本例中,我们将了解如何在图像处理的上下文中使用几何变换。

import math
import numpy as np
import matplotlib.pyplot as plt

from skimage import data
from skimage import transform

基础知识#

支持多种不同的几何变换类型:相似性、仿射、投影和多项式。有关可用变换类型的教程,请参见 单应性类型

几何变换可以使用显式参数(例如缩放、剪切、旋转和平移)或变换矩阵来创建。

首先,我们使用显式参数创建变换

tform = transform.SimilarityTransform(scale=1, rotation=math.pi / 2, translation=(0, 1))
print(tform.params)
[[ 6.123234e-17 -1.000000e+00  0.000000e+00]
 [ 1.000000e+00  6.123234e-17  1.000000e+00]
 [ 0.000000e+00  0.000000e+00  1.000000e+00]]

或者,您可以通过变换矩阵本身定义变换

然后,这些变换对象可用于在源和目标坐标系之间应用正向和反向坐标变换

coord = [1, 0]
print(tform2(coord))
print(tform2.inverse(tform(coord)))
[[6.123234e-17 3.000000e+00]]
[[ 0.000000e+00 -6.123234e-17]]

图像扭曲#

几何变换也可用于扭曲图像

text = data.text()

tform = transform.SimilarityTransform(
    scale=1, rotation=math.pi / 4, translation=(text.shape[0] / 2, -100)
)

rotated = transform.warp(text, tform)
back_rotated = transform.warp(rotated, tform.inverse)

fig, ax = plt.subplots(nrows=3)

ax[0].imshow(text, cmap=plt.cm.gray)
ax[1].imshow(rotated, cmap=plt.cm.gray)
ax[2].imshow(back_rotated, cmap=plt.cm.gray)

for a in ax:
    a.axis('off')

plt.tight_layout()
plot geometric

参数估计#

除了上面提到的基本功能外,您还可以使用最小二乘法估计几何变换的参数。

这可以在其他方面用于图像配准或校正,其中您在两幅图像中有一组控制点或同源/对应点。

假设我们想要识别一张未从正面拍摄,而是以一定角度拍摄的照片上的字母。在平面纸张表面的最简单情况下,字母会发生投影变形。简单的匹配算法将无法匹配此类符号。解决此问题的一种方法是扭曲图像以消除变形,然后应用匹配算法

text = data.text()

src = np.array([[0, 0], [0, 50], [300, 50], [300, 0]])
dst = np.array([[155, 15], [65, 40], [260, 130], [360, 95]])

tform3 = transform.ProjectiveTransform()
tform3.estimate(src, dst)
warped = transform.warp(text, tform3, output_shape=(50, 300))

fig, ax = plt.subplots(nrows=2, figsize=(8, 3))

ax[0].imshow(text, cmap=plt.cm.gray)
ax[0].plot(dst[:, 0], dst[:, 1], '.r')
ax[1].imshow(warped, cmap=plt.cm.gray)

for a in ax:
    a.axis('off')

plt.tight_layout()
plt.show()
plot geometric

上述估计依赖于对点位置的准确了解以及对其对应关系的准确选择。如果点位置存在不确定性,则可以提供权重,以便生成的变换优先考虑对权重最高的点的精确拟合。当对应点不完全准确时,一种称为 RANSAC 算法 的替代方法很有用。有关如何在 scikit-image 中使用此方法的详细说明,请参见 使用 RANSAC 进行鲁棒匹配 教程。

脚本的总运行时间:(0 分钟 0.601 秒)

由 Sphinx-Gallery 生成的图库