2.3.2 DDPM의 학습1. DDPM에서의 목표DDPM의 학습 목표는 생성 확률 분포 $p_\theta(x_0)$를 최대화하는 것이다. 하지만 이때 $x_0$는 관측값이고, 생성 과정에서는 $x_1, x_2, ..., x_T$와 같은 잠재변수(latent variables)가 존재한다.직접적으로 $p_\theta(x_0)$를 계산하기 어렵기 때문에 최대우도추정(Maximum Likelihood Estimation)을 통해 간접적으로 학습하며, 이때 다음과 같이 marginalize(: 어떤 변수 집합에서 일부 변수에 대해 적분을 수행해 없애고, 나머지 변수에 대한 주변 확률분포를 구하는 것. 예: $p(x) = \int p(x, y) \, dy$) 한다:$$p_\theta(x_0) = \int p_\..