A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
関連ページ
1 誘導
拡散模型の美点には,条件付けが可能で拡張性に優れているという点もある.
実際,拡散模型の出現後,Conditional VAE (Kingma et al., 2014) などの従来手法を凌駕する条件付き生成が可能であることが直ちに理解された.
1.1 はじめに
「誘導」ではまず,DDPM (Ho et al., 2020) でタイムステップ
そしてデータ
しかしこのアプローチの問題は,ラベル
そこで目的関数に,条件付き分布
1.2 条件付きスコア場
条件付き分布
このとき
すなわち,条件付き確率
1.3 分類器による誘導 (CG)
式 (1) から,
これを CG: Classifier Guidance (Dhariwal and Nichol, 2021) といい,サンプリング中に各ステップで少しずつ
さらに,
1.4 分類器なしの誘導
CG はいわばアドホックな方法であり,外部の分類器
そのためには,式 (2) から
このアプローチを Classifier-Free Diffusion Guidance (Ho and Salimans, 2021) という.
その際は,新たなクラスラベル
データセット内にランダムに1から2割の画像をクラスラベル
同様の方法を,スコアマッチングではなくフローマッチングを行うことを (Dao et al., 2023), (Q. Zheng et al., 2023) が提案している.
この方法は,追加の分類器の訓練が必要ないだけでなく,サンプリングのクオリティも向上する (Nichol et al., 2022), (Saharia, Chan, Chang, et al., 2022).これは分類タスクで訓練されたスコア
1.5 高解像度画像生成への応用
1.5.1 Cascaded Generation
条件付き生成の技術はそのままで,最終的なクオリティを向上させるためには,Cascading (Ho et al., 2022) が使用可能である.
これは,画像生成は
この方法の美点は,条件付き生成器をたくさんスタックしたのちに,拡散模型間の段階でも Gauss ノイズや blur を印加することで,さらに最終的なクオリティが上げられるという (Ho et al., 2022).これを conditioning augmentation と呼んでいる.
この方法は最初から高解像度での生成を目指して大規模な単一の拡散模型を設計するよりも大きく計算コストを削減できる.
Google も Imagen (Saharia, Chan, Saxena, et al., 2022) でこのアーキテクチャを用いている.
1.5.2 Self-Conditioning (T. Chen et al., 2023)
拡散モデルを自己再帰的に用い,自身の前回の出力を今回の入力として逐次的にサンプリングを繰り返すことで,サンプリングのクオリティをさらに向上する自己条件づけが (T. Chen et al., 2023) で提案された.
この方法は RoseTTAFold Diffusion (Watson et al., 2023) によるたんぱく質構造生成でも用いられている:
1.6 逆問題への応用
一方で単一の
そして
(Chung et al., 2023) はこの方法を Computer Vision における非線型逆問題に適用している.
(Song et al., 2023) では Monte Carlo 法が用いられている.
拡散模型の一般の事後分布サンプリングのための応用については次稿も参照:
2 フローマッチングによる連続な条件付け
2.1 連続な条件付き生成
連続な変数に対する条件付き確率からの生成は CcGAN (Ding et al., 2021) などでも試みられていた.
AlphaFold 3 (Abramson et al., 2024) や RoseTTAFold Diffusion (Watson et al., 2023), (Krishna et al., 2024) など,たんぱく質構造生成模型において拡散モデルが用いられている理由も,高精度な条件付き生成が可能であることが大きいという.
このことに加えて連続な変数に対する条件付けを可能にすることは,拡散モデルの拡張性をさらに高めることになる.
そもそも拡散モデルは 連続時間正規化流 (CNF) と合流し,フローマッチング(第 2.2 節)によりノイズ分布
この方法では,新たな条件付け変数
これを行列値ベクトル場の理論を通じて達成するのが 拡張フローマッチング (EFM: Extended Flow Matching) (Isobe et al., 2024) である.
このようなフローマッチングの拡張は (R. T. Q. Chen and Lipman, 2024) でも考えられている.
2.2 フローマッチング (FM)
2つの確率分布
そのための1つのアプローチとして,連続方程式 というPDE
このような
2.3 条件付きフローマッチング (CFM)
仮に
この場合,
従って,
しかし,各
2.4 最適輸送 CFM (OT-CFM)
ここで形式的に,条件付ける変数
その中でも特に,
このとき,
訓練時は,CFM の目的関数 (8) を計算するために
このように,2つの分布
2.5 上の最適化としての見方
実は OT-CFM は,2つの確率密度
条件付きフローマッチングでは,このような曲線
実は Dirichlet 汎函数
従って,
これが OT-CFM の
2.6 拡張フローマッチング (GFM)
前節での観察は次のように要約できる:
こう考えると,Dirichlet エネルギーの言葉で他の帰納バイアスを導入することが考えられる.
ここで条件付けの議論(第 2.1 節)に戻ってくる.最適輸送のための
これは,
これは新たな
これが 拡張フローマッチング (EFM: Extended Flow Matching) (Isobe et al., 2024) である.
2.7 GFM の無限次元最適化
ただし,拡張 Dirichlet エネルギー (Lavenant, 2019)
すると無限次元最適化になってしまうため,適切な RKHS
この解
これを (Isobe et al., 2024) は MMOT-EFM と呼んでいる.
3 文献紹介
本記事の後半第 2 節は,(Tong et al., 2024), (Isobe et al., 2024) の解説である.
前半の内容に関して,メンダコ氏によるブログ記事 AlphaFold の進化史 は AlphaFold3 が丁寧に解説されている.
当該ブログは丁寧に書かれており,大変おすすめできる.
Alphafold3とは長大な条件付けネットワークを備えた全原子拡散生成モデルであると前述したとおり、Alphafold3では必須入力としてタンパク質配列を、任意入力として核酸配列、SMILES形式で表現された低分子リガンド、金属イオンなどを長大な条件付けネットワークに入力することで、拡散モデルへの条件付けベクトルを作成します。
DeepLearningで大規模分子の構造分布を予測するなんて数年前には考えられませんでしたが、拡散モデルによってすでに現実になりつつあります。一例として Distributional GraphormerというMicrosoft Researchの研究 (S. Zheng et al., 2024) を紹介します。
続きはぜひ,メンダコ氏のブログでお読みください.
(Dao et al., 2023) のプロジェクトページは こちら.
References
Footnotes
が と同じ画像である場合は,(Ho et al., 2022) のように にそのまま連結することも考えられる.↩︎すべての
は の極限で決定論的なダイナミクスを定めていた.これを と表すこととする.↩︎