Bonnaire, Urfin, Biroli & Mézard (2025, NeurIPS)
Why Diffusion Models Don’t Memorize: The Role of Implicit Dynamical Regularization in Training
1/26/2026
empirical score と population score の違いは,生成の最終段階において,関数的には近いかもしれないが,スペクトル的には高周波成分がひらすら noisy になる.しかし NN の spectral bias により,低周波成分だけを学んでいることが,汎化の主な理由なのではないか?
data dependent な高周波成分の学習時間が O(n) のスケールでかかるのも独立で興味に値する新たな発見になっている.