前言
或许这个问题对于真正懂的人,根本不会是个问题,也就是一知半解的人才会有这个疑问。
对我启发最大的一个视频是这个:https://www.bilibili.com/video/BV1di4y1y7au,看懂其的前提我觉得是要熟练掌握工程上傅里叶变换的意义,其实也不麻烦,就是不同周期函数的叠加就是了。
另外提供有意义信息的还有如下:
- 知乎的
背景
翻过了大多数的博客,很多人都知道的东西:图片上的高频分量对应图像边缘,图片上的低频分量对应图像的大片色块,换句话说,图片上变化快的区域对应高频分量,变换慢的区域对应低频分量。
为什么会是此?
- 有些人会谈到图像梯度(图像的梯度就是相邻量像素的向量差,有大小和方向),说“梯度大就周期短,周期短就频率大”。
- 有些人直接就说,“图像的频域图谱就是图像的梯度”,梯度大的反应在频谱图上就是亮色多。
不得不说这些人真的是什么都敢说,没有真正理解问题。
其实工程师也不需要理解背后的“为什么”,知道有这个特性,会用就行。
但是不懂不能编造出来个理由骗自己,骗完自己还发到网上来误导别人啊。
更多的人直接用实验说明一切,直接手写低通滤波和高通滤波,输入图片看结果。很有说服力,也很生动,但是我个人还是想知道背后的关系。
前提
对于不懂傅里叶变换的读者,我推荐先看懂傅里叶变换,这篇14年的帖子,经典永流传:https://zhuanlan.zhihu.com/p/19759362
正文
图片是二维的,有两个方位,对应着我们应当用二维离散傅里叶,但是没有必要,我们可以直接用一维的做例子推广到二维就行了。你可以简单理解为只取图片的一行像素或者一列像素。
对于一维的傅里叶变换:
这个图很好的描述了不同正弦波叠加后的合成,其实你可以发现使得波突然上升的那个分量,是振幅最大的分量的贡献。
“波突然上升”在图像里意味着什么?
就是梯度的大,也就意味着相邻两像素的差值很大,也就是图像的边缘。
那么,怎样的分量才能让“波突然上升”?振幅大的分量。
哪里有振幅大的分量?
高中学过,一个分量的通用形式是:
A
s
i
n
(
λ
t
+
ϕ
)
Asin(\lambda t+\phi)
Asin(λt+ϕ),A是系数(振幅),
λ
\lambda
λ是频率,
ϕ
\phi
ϕ是初相位。
傅里叶变换公式告诉我们,频率基中的
λ
\lambda
λ和其对应系数(也就是对应振幅)
A
A
A的关系如下:
A
(
λ
)
=
1
2
π
∫
−
∞
∞
f
(
t
)
e
x
p
(
−
i
λ
t
)
d
t
A(\lambda)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}f(t)exp(-i\lambda t)dt
A(λ)=2π1∫−∞∞f(t)exp(−iλt)dt
简单说,是一个 λ \lambda λ对应一个 A A A,两两成对。想要 A A A大,其 λ \lambda λ一定要大。而 λ \lambda λ就是频率,其大,显然意味着频率高,对应也就是高频分量。
低频分量的可以以同样的方式推出。
然后再从一维推广到二维就可以了。对于推广,可以看我一开始列出来的那个知乎。我不赘述了。
总结
网络上的帖子不能够盲目相信。对于问题不能自欺欺人,一叶障目。