1 PCF的数学原理：Filter / Convolution

$\qquad$ 在shadow map上应用PCF算法做深度测试的时候，不是与单个纹素作比较，而是周围一圈 $n\times n$ 个记录的深度是否遮挡住了该着色点，最后进行加权平均得到一个(0,1)的值，作为该着色点可见性（阴影软硬程度）的描述。

这个算法的过程，在数学上称为卷积

可以用这个简化的公式表示： $\displaystyle[w * f](p)=\sum_{q∈N(p)}w(p,q)f(q)$

符号	意义
$f (p)$	返回着色点p实际深度与shadow map上的深度的比较结果，非0即1
$[w * f]$	$*$ 为卷积符号，表示对函数 $f$ 应用一个卷积
$[w * f] (p)$	被卷积后的函数 $f$ 在传入着色点 $p$ 后应该返回什么值
$q \in N (p)$	p点附近的一个点q
$w (p, q)$	q点对应的权值，可以根据q到p的距离得到
$\displaystyle\sum_{q∈N(p)}w(p,q)f(q)$	shadow map上，把p邻域的一个点q深度与p实际深度作比较(非0即1)，再乘以对应的权值，然后对每个q的加权后的结果进行相加，得到 $[0, 1]$ 内一个数作为着色点的visibility返回

PSCC更详细的公式是这个：

$\large \displaystyle V(x)=\sum_{q∈N(p)}w(p,q)·\chi^+[D_{SM}(q) -D_{scene}(p)]$

符号	意义
$V (x)$	Visibility 可见性；可见：1，不可见：0
$\chi^+$	符号函数，LaTex符号：\chi，读音“铠”，很多人也读作"卡"，卡方分布 $\chi ^2$ 也是这个符号。自变量大于0返回1，小于0返回0
$D_{SM}$	q点在shadow map中记录的深度
$D_{scene}(p)$	场景中着色点p的实际深度
$w (p, q)$	q对应的权值

有了严谨的数学表达式，我们可以严谨的定义一下错误的理解PCSS所对应的数学表达式是什么样的

PCF不是filtering shadow map，即对周围深度做平均，然后用平均深度跟着色点p深度进行比较，这样结果必然非0即1
$\displaystyle V(x)\ne\chi^+\{[w*D_{SM}](q) -D_{scene}(p)\}$
PFC也不是在最终生成有锯齿的硬阴影的图像上，做filtering
$\displaystyle V(x)\ne\sum_{y∈N(x)}w(y,x)V(x)$ ，x对应图像中的某个点，y是x附近某个点，V是图像

2 PCSS回顾

Step1：Blocker Search
$\quad\ \:$ 对于每个着色点p，找到shadow map上一块区域，计算遮挡物的平均深度，把区域所有texel都找一遍，判断是不是遮挡物，如果是遮挡物，则累加，最后除以遮挡物的个数。
Step2：Penumbra Estimation
$\quad\ \ \:$ 公式算出W_半影，根据这个得到filter size
Step3：Percentage Closer Filtering

这些步骤里，哪些特别慢？

第1、3步，每个着色点都要遍历深度图上一大片区域的纹素，并且这两步里面都要这样遍历，就很费性能
想要阴影够软，需要大的filter size，大filter size 导致计算缓慢。

另一种比较好的解决方式，是VSSM

3 Variance Soft Shadow Mapping(VSSM)

$\qquad$ 这个算法是对PCSS算法的改进，可以更快得出近似的结果

3.1 VSSM对PCF的优化

PCSS中的 Percentage Closer Filtering目的是什么？

找到着色点对应到shadow map上周围某区域中，比该着色点深度更浅的点的比例是多少
也就是，在搜索区域内有多少比shading point深度更浅的像素
类比于找到这场考试里比我成绩更好的学生们，看我的排名占百分之几

我想知道我的排名，但我又不香看每个学生的成绩，咋办?

PCF原本的做法，遍历每个学生，相当于生成一个直方图如下，成绩比我好的占比多少一目了然
不那么准确但特别近似的方法：得到一个正态分布曲线（normal distribution）
定义正态分布需要两个条件：均值（期望）、方差
均值决定了波峰在哪，方差决定区间范围

VSSM的第一个核心思想Key idea： 快速计算得到一个区域的深度均值(mean)和方差(variance)

(1) 求均值(Mean/Average)

MIPMAP（不准，且对长方形不友好）
Summed Area Tables(SAT)

(2) 求方差(Variance)

$Var(X)=E(X^2)-E^2(X)$ —— 借助数学公式，通过两种期望值，就能求得方差

$V a r (X)$	X区域的方差
$E(X^2)$	X区域所有深度的平方的期望（这就需要生成一张记录深度的平方shadow map）
$E^2(X)$	X区域的所有深度值的期望的平方（用原本的shadow map即可算出）

所以求方差需要额外生成一张深度的平方的shadow map

(3) 根据均值和方差，得到呈正态分布的PDF —— 实际上不需要这一步(有切比雪夫不等式可跳过此步骤)

欲得到shadow map 上某块区域上比着色点更近的纹素的百分比
计算概率密度函数PDF(Probability Density Function)阴影部分面积。

要得到上面的概率密度函数(分布)，还是挺麻烦的，而且相对来说还是"过于精确"，从而下面VSSM算法又找到一个经典不等式

3.1.1 切比雪夫不等式(Chebychev’s inequality)

$\displaystyle\Large\mathbf\color{red}{P(x>t)≤\frac{σ}{σ^2+(t-\mu)^2}}$
$\mu: mean\:\qquad\sigma^2:variance$

通过这个不等式，可以得到：随机变量取值超过 $t$ 的概率，也可理解成得到超过t的数量占比多少
不需要知道该随机变量分布长什么样（实际上正不正态都不太重要），只需要知道该分布的期望和方差
也就是上面第(3)步没用了

在这里插入图片描述
这个不等式用在PCF上，直接可以得知深度超过t的texel的百分比P，P直接就是该点的Visbility值

2.1.2 VSSM加速PCF的步骤总结

生成shadow map的同时，生成一张存放深度的平方的平方深度图(Square depth map)
求深度图上某区域的均值，MipMap，不用循环，O(1)
求平方深度图上某区域的均值，依旧MipMap，O(1)
知道两个均值，根据公式 $\small Var(X)=E(X^2)-E^2(X)$ 得到方差
根据切比雪夫不等式，直接求出该点可见性Visibility

现在来看，是否完美解决了第三步PCF特别慢的问题？—— 是

生成多张MipMap、一张平方深度图，开销很小，因为GPU对于一张图生成MipMap速度特别快，可以认为几乎不花时间，另一个没有介绍的(SAT)的生成相对慢一点
不需要循环遍历区域所有像素，然后一个个的比较，最后加权求和，很大程度的减少了计算量

PCSS第一步：Blocker search特别慢的问题还没解决

Blocker search

求平均的遮挡物的深度，把区域所有texel都找一遍，判断是不是遮挡物，如果是遮挡物，则累加，最后除以遮挡物的个数，如着色点深度为7，则应该计算shadow map上蓝色区域的深度作为平均遮挡物深度
这一步实际上不是区域上所有纹素的平均，而是那些z<t的纹素记录的深度求平均，很慢

3.2 VSSM对Blocker Search的优化

目标：得到遮挡物的平均深度 $Z_{occ}$

Key idea：搞些小手段，弄到非遮挡物的平均深度 $Z_{unocc}$

首先两者一定满足这个等式
$\displaystyle \frac{N_1}{N}Z_{unocc}+\frac{N_2}{N}Z_{occ} = Z_{Avg}$
$N_1$ ：非遮挡物纹素个数， $N_2$ ：遮挡物纹素个数， $N$ ：总的区域纹素个数， $Z_{Avg}$ ：总的区域深度均值

这两个权重刚好又能用切比雪夫近似： $\displaystyle\color{blue} \frac{N_1}{N} = P(x > t)\ ，\frac{N_2}{N} = 1-P(x > t)$
通过MipMap范围查询可得 $\color{blue}Z_{Avg}$ ，我们想要得到 $Z_{occ}$ ，还有个未知量 $Z_{unocc}$ 没算出来，
近似： $\color{blue}Z_{unocc} = t$
唯一的未知量 $\color{red}Z_{occ}$ 自然就能求出