[Open DMQA Seminar] Conditional Diffusion Models

생성모델은 몇년동안 눈부신 발전을 이루어 왔다. 그 중 diffusion 모델은 높은 퀄리티와 다양성을 갖춘 샘플들을 생성하는 능력을 보였으며, text, image 등 다른 modality 를 condition 으로 주어 사용자가 원하는 이미지를 생성하는 방법론 또한 발전해 왔다. 이에 본 세미나는 diffusion 모델의 근본적인 원리와 loss function 의 derivation, 그리고 text 등 원하는 샘플을 생성하는 conditional diffusion 모델에 대해 살펴본다.
[1] Sohl-Dickstein, Jascha, et al. "Deep unsupervised learning using nonequilibrium thermodynamics." International Conference on Machine Learning. PMLR, 2015
[2] Ho, Jonathan, Ajay Jain, and Pieter Abbeel. "Denoising diffusion probabilistic models." Advances in Neural Information Processing Systems 33 (2020): 6840-6851
[3] Kingma, Diederik P., and Max Welling. "Auto-encoding variational bayes." arXiv preprint arXiv:1312.6114 (2013)
[4] Dhariwal, Prafulla, and Alexander Nichol. "Diffusion models beat gans on image synthesis." Advances in Neural Information Processing Systems 34 (2021): 8780-8794
[5] Ho, Jonathan, and Tim Salimans. "Classifier-free diffusion guidance." arXiv preprint arXiv:2207.12598 (2022)
[6] Rombach, Robin, et al. "High-resolution image synthesis with latent diffusion models." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022

Пікірлер: 8

  • @daehwaa
    @daehwaa6 ай бұрын

    유튜브에 올라온 Diffusion 영상들중 제일 명확한거 같아요. 잘 봤습니다!

  • @benjaminp.9572
    @benjaminp.95722 ай бұрын

    발표자료와 내용이 너무 깔끔합니다. 많은 도움 되었습니다! 감사합니다!

  • @user-vz8kh6mj4j
    @user-vz8kh6mj4j7 ай бұрын

    재미있게 잘 봤습니다. 감사합니다.

  • @The_One_Who_Moves_the_Stars
    @The_One_Who_Moves_the_Stars6 ай бұрын

    음성이 좋으니 모든게 좋네요.

  • @anthonydavisyo6067
    @anthonydavisyo6067 Жыл бұрын

    영상감사합니다, 질문하나있는데 diffusion model을 사용할때 얼마나 많은 denoising time steps을 가져갈지는 데이터에 따라 달라지는 변수이고 경험적으로 최적의 time step을 찾아야하나요? 아니면 optimal한 time step이 언제인지를 알 수 있는 함수가 있을까요 감사합니다

  • @heejuneAhn
    @heejuneAhn8 ай бұрын

  • @jochaboon
    @jochaboon10 ай бұрын

    이게 왜 재밌죠? (수학 하나도 모름)

  • @jkgoodgood1729
    @jkgoodgood17294 ай бұрын

    석사 수준의 설명 ㅎ

Келесі