DPP

1. Determinantal Point Process (DPP)

$z$ $x$ 之间的相似度（similarity），又保证了所选的demonstration的多样性（diversity）。

$Z$ $Z$ $x$ $Z$ $x$ $x$ $Z$ 代表待选择的若干个demonstrations（candidates）。

$Z=\{1,2,3, ...,M\}$ $Z$ $L⊆ R^{M\times M}$ $Z$ $Y$ $P(Y)\propto det(L_Y)$ $L_Y$ $Y$ $L$ 中对应的元素组成的行列式的值。

$X$ $X^TLX\geq 0$ $L$ 是半正定矩阵。

例如：

DPP_example

$L$ $B$ $L=B^TB$ $P(Y)\propto det(L_Y)=Vol^2(B_i)$ $i\in Y$ 。

$B_i$ $B_i=r_if_i$ $r_i$ $r_i\geq0$ $S_{ij}=<f_i, f_j>$ $||f_i||_2=1$ ，于是有：

\begin{matrix} L_{i j} =< B_{i}, B_{j} >=< r_{i} f_{i}, r_{j} f_{j} >= r_{i} r_{j} s_{i j} \\ P (Y) \propto d e t (L_{Y}) = \prod_{i \in Y} r_{i}^{2} d e t (S_{Y}) . \end{matrix}

$L_{ij}$ $L$ $det(L_Y)$ $S_Y$ $r_i$ $s_{ij}$ $P(Y)$ $Y$ 同时具有越大的similarity好人diversity。

2. 优化

$Y^*=argmax\{det(L_Y)\}$ $f(Y)=\log(argmax\{det(L_Y)\})$ ，次模函数即边际效应，就是说随着向集合中添加元素，函数值的增加量会愈来越小，举个🌰，有一天你非常饿，吃第一口饭的时候获得的满足感很大，随着往后吃的越来越饱，你没吃一口饭的快乐和满足感都会减小，这就是边际效应。（emmm我觉得这个就像是谈恋爱，一开始是热恋期，随着天数的增加越来越觉得增加的幸福感很少了，最后变成日复一日也就那样。）

言归正传，既然这个取对数后的优化目标符合次模函数，那么有：

\begin{matrix} i =\in Z, X \subseteq Y \subseteq Z / {i}, \\ f (X \cup i) - f (X) \geq f (Y \cup i) - f (Y), \\ 这 里 理 解 为 i 加 入 X 比 i 加 入 Y 更 早 ， 属 于 前 半 段 的 热 恋 期 。 \end{matrix}

直观说在前期集合小的时候加入一个元素带来的增益要更大。

那么优化问题可以转换为贪婪的形式：

Y^{*} = a r g m a x {f (Y \cup i) - f (Y)} = a r g m a x {\log (d e t (L_{Y \cup i})) - \log (d e t (L_{Y}))}

也就是说每次选择添加对下游任务最有帮助受益最大的example，知道满足指定的个数或者其他条件，构成demonstration。

以上内容参考了博客。